1da2e3ebdSchin /***********************************************************************
2da2e3ebdSchin *                                                                      *
3da2e3ebdSchin *               This software is part of the ast package               *
4*b30d1939SAndy Fiddaman *          Copyright (c) 1985-2012 AT&T Intellectual Property          *
5da2e3ebdSchin *                      and is licensed under the                       *
6*b30d1939SAndy Fiddaman *                 Eclipse Public License, Version 1.0                  *
77c2fbfb3SApril Chin *                    by AT&T Intellectual Property                     *
8da2e3ebdSchin *                                                                      *
9da2e3ebdSchin *                A copy of the License is available at                 *
10*b30d1939SAndy Fiddaman *          http://www.eclipse.org/org/documents/epl-v10.html           *
11*b30d1939SAndy Fiddaman *         (with md5 checksum b35adb5213ca9657e911e9befb180842)         *
12da2e3ebdSchin *                                                                      *
13da2e3ebdSchin *              Information and Software Systems Research               *
14da2e3ebdSchin *                            AT&T Research                             *
15da2e3ebdSchin *                           Florham Park NJ                            *
16da2e3ebdSchin *                                                                      *
17da2e3ebdSchin *                 Glenn Fowler <gsf@research.att.com>                  *
18da2e3ebdSchin *                  David Korn <dgk@research.att.com>                   *
19da2e3ebdSchin *                   Phong Vo <kpv@research.att.com>                    *
20da2e3ebdSchin *                                                                      *
21da2e3ebdSchin ***********************************************************************/
22da2e3ebdSchin #pragma prototyped
23da2e3ebdSchin 
24da2e3ebdSchin /*
25da2e3ebdSchin  * D. G. Korn
26da2e3ebdSchin  * G. S. Fowler
27da2e3ebdSchin  * AT&T Research
28da2e3ebdSchin  *
29da2e3ebdSchin  * match shell file patterns
30da2e3ebdSchin  * this interface is a wrapper on regex
31da2e3ebdSchin  *
32da2e3ebdSchin  *	sh pattern	egrep RE	description
33da2e3ebdSchin  *	----------	--------	-----------
34da2e3ebdSchin  *	*		.*		0 or more chars
35da2e3ebdSchin  *	?		.		any single char
36da2e3ebdSchin  *	[.]		[.]		char class
37da2e3ebdSchin  *	[!.]		[^.]		negated char class
38da2e3ebdSchin  *	[[:.:]]		[[:.:]]		ctype class
39da2e3ebdSchin  *	[[=.=]]		[[=.=]]		equivalence class
40da2e3ebdSchin  *	[[...]]		[[...]]		collation element
41da2e3ebdSchin  *	*(.)		(.)*		0 or more of
42da2e3ebdSchin  *	+(.)		(.)+		1 or more of
43da2e3ebdSchin  *	?(.)		(.)?		0 or 1 of
44da2e3ebdSchin  *	(.)		(.)		1 of
45da2e3ebdSchin  *	@(.)		(.)		1 of
46da2e3ebdSchin  *	a|b		a|b		a or b
47da2e3ebdSchin  *	\#				() subgroup back reference [1-9]
48da2e3ebdSchin  *	a&b				a and b
49da2e3ebdSchin  *	!(.)				none of
50da2e3ebdSchin  *
51da2e3ebdSchin  * \ used to escape metacharacters
52da2e3ebdSchin  *
53da2e3ebdSchin  *	*, ?, (, |, &, ), [, \ must be \'d outside of [...]
54da2e3ebdSchin  *	only ] must be \'d inside [...]
55da2e3ebdSchin  *
56da2e3ebdSchin  */
57da2e3ebdSchin 
58da2e3ebdSchin #include <ast.h>
59da2e3ebdSchin #include <regex.h>
60da2e3ebdSchin 
61da2e3ebdSchin static struct State_s
62da2e3ebdSchin {
63da2e3ebdSchin 	regmatch_t*	match;
64da2e3ebdSchin 	int		nmatch;
65da2e3ebdSchin } matchstate;
66da2e3ebdSchin 
67*b30d1939SAndy Fiddaman #define STR_INT		040000
68*b30d1939SAndy Fiddaman 
69da2e3ebdSchin /*
70da2e3ebdSchin  * subgroup match
71da2e3ebdSchin  * 0 returned if no match
72da2e3ebdSchin  * otherwise number of subgroups matched returned
73da2e3ebdSchin  * match group begin offsets are even elements of sub
74da2e3ebdSchin  * match group end offsets are odd elements of sub
75da2e3ebdSchin  * the matched string is from s+sub[0] up to but not
76da2e3ebdSchin  * including s+sub[1]
77da2e3ebdSchin  */
78da2e3ebdSchin 
79da2e3ebdSchin int
strgrpmatch(const char * b,const char * p,ssize_t * sub,int n,register int flags)80*b30d1939SAndy Fiddaman strgrpmatch(const char* b, const char* p, ssize_t* sub, int n, register int flags)
81da2e3ebdSchin {
82da2e3ebdSchin 	register regex_t*	re;
83*b30d1939SAndy Fiddaman 	register ssize_t*	end;
84da2e3ebdSchin 	register int		i;
85da2e3ebdSchin 	register regflags_t	reflags;
86da2e3ebdSchin 
87da2e3ebdSchin 	/*
88da2e3ebdSchin 	 * 0 and empty patterns are special
89da2e3ebdSchin 	 */
90da2e3ebdSchin 
91da2e3ebdSchin 	if (!p || !b)
92da2e3ebdSchin 	{
93da2e3ebdSchin 		if (!p && !b)
94da2e3ebdSchin 			regcache(NiL, 0, NiL);
95da2e3ebdSchin 		return 0;
96da2e3ebdSchin 	}
97da2e3ebdSchin 	if (!*p)
987c2fbfb3SApril Chin 	{
997c2fbfb3SApril Chin 		if (sub && n > 0)
100*b30d1939SAndy Fiddaman 		{
101*b30d1939SAndy Fiddaman 			if (flags & STR_INT)
102*b30d1939SAndy Fiddaman 			{
103*b30d1939SAndy Fiddaman 				int*	subi = (int*)sub;
104*b30d1939SAndy Fiddaman 
105*b30d1939SAndy Fiddaman 				subi[0] = subi[1] = 0;
106*b30d1939SAndy Fiddaman 			}
107*b30d1939SAndy Fiddaman 			else
108*b30d1939SAndy Fiddaman 				sub[0] = sub[1] = 0;
109*b30d1939SAndy Fiddaman 		}
110da2e3ebdSchin 		return *b == 0;
1117c2fbfb3SApril Chin 	}
112da2e3ebdSchin 
113da2e3ebdSchin 	/*
114da2e3ebdSchin 	 * convert flags
115da2e3ebdSchin 	 */
116da2e3ebdSchin 
117da2e3ebdSchin 	if (flags & REG_ADVANCE)
118da2e3ebdSchin 		reflags = flags & ~REG_ADVANCE;
119da2e3ebdSchin 	else
120da2e3ebdSchin 	{
121da2e3ebdSchin 		reflags = REG_SHELL|REG_AUGMENTED;
122da2e3ebdSchin 		if (!(flags & STR_MAXIMAL))
123da2e3ebdSchin 			reflags |= REG_MINIMAL;
124da2e3ebdSchin 		if (flags & STR_GROUP)
125da2e3ebdSchin 			reflags |= REG_SHELL_GROUP;
126da2e3ebdSchin 		if (flags & STR_LEFT)
127da2e3ebdSchin 			reflags |= REG_LEFT;
128da2e3ebdSchin 		if (flags & STR_RIGHT)
129da2e3ebdSchin 			reflags |= REG_RIGHT;
130da2e3ebdSchin 		if (flags & STR_ICASE)
131da2e3ebdSchin 			reflags |= REG_ICASE;
132da2e3ebdSchin 	}
133da2e3ebdSchin 	if (!sub || n <= 0)
134da2e3ebdSchin 		reflags |= REG_NOSUB;
135da2e3ebdSchin 	if (!(re = regcache(p, reflags, NiL)))
136da2e3ebdSchin 		return 0;
137da2e3ebdSchin 	if (n > matchstate.nmatch)
138da2e3ebdSchin 	{
139da2e3ebdSchin 		if (!(matchstate.match = newof(matchstate.match, regmatch_t, n, 0)))
140da2e3ebdSchin 			return 0;
141da2e3ebdSchin 		matchstate.nmatch = n;
142da2e3ebdSchin 	}
143da2e3ebdSchin 	if (regexec(re, b, n, matchstate.match, reflags & ~(REG_MINIMAL|REG_SHELL_GROUP|REG_LEFT|REG_RIGHT|REG_ICASE)))
144da2e3ebdSchin 		return 0;
145da2e3ebdSchin 	if (!sub || n <= 0)
146da2e3ebdSchin 		return 1;
147da2e3ebdSchin 	i = re->re_nsub;
148*b30d1939SAndy Fiddaman 	if (flags & STR_INT)
149*b30d1939SAndy Fiddaman 	{
150*b30d1939SAndy Fiddaman 		int*	subi = (int*)sub;
151*b30d1939SAndy Fiddaman 		int*	endi = subi + n * 2;
152*b30d1939SAndy Fiddaman 
153*b30d1939SAndy Fiddaman 		for (n = 0; subi < endi && n <= i; n++)
154*b30d1939SAndy Fiddaman 		{
155*b30d1939SAndy Fiddaman 			*subi++ = matchstate.match[n].rm_so;
156*b30d1939SAndy Fiddaman 			*subi++ = matchstate.match[n].rm_eo;
157*b30d1939SAndy Fiddaman 		}
158*b30d1939SAndy Fiddaman 	}
159*b30d1939SAndy Fiddaman 	else
160da2e3ebdSchin 	{
161*b30d1939SAndy Fiddaman 		end = sub + n * 2;
162*b30d1939SAndy Fiddaman 		for (n = 0; sub < end && n <= i; n++)
163*b30d1939SAndy Fiddaman 		{
164*b30d1939SAndy Fiddaman 			*sub++ = matchstate.match[n].rm_so;
165*b30d1939SAndy Fiddaman 			*sub++ = matchstate.match[n].rm_eo;
166*b30d1939SAndy Fiddaman 		}
167da2e3ebdSchin 	}
168da2e3ebdSchin 	return i + 1;
169da2e3ebdSchin }
170da2e3ebdSchin 
171da2e3ebdSchin /*
172da2e3ebdSchin  * compare the string s with the shell pattern p
173da2e3ebdSchin  * returns 1 for match 0 otherwise
174da2e3ebdSchin  */
175da2e3ebdSchin 
176da2e3ebdSchin int
strmatch(const char * s,const char * p)177da2e3ebdSchin strmatch(const char* s, const char* p)
178da2e3ebdSchin {
179da2e3ebdSchin 	return strgrpmatch(s, p, NiL, 0, STR_MAXIMAL|STR_LEFT|STR_RIGHT);
180da2e3ebdSchin }
181da2e3ebdSchin 
182da2e3ebdSchin /*
183da2e3ebdSchin  * leading substring match
184da2e3ebdSchin  * first char after end of substring returned
185da2e3ebdSchin  * 0 returned if no match
186da2e3ebdSchin  *
187da2e3ebdSchin  * OBSOLETE: use strgrpmatch()
188da2e3ebdSchin  */
189da2e3ebdSchin 
190da2e3ebdSchin char*
strsubmatch(const char * s,const char * p,int flags)191da2e3ebdSchin strsubmatch(const char* s, const char* p, int flags)
192da2e3ebdSchin {
193*b30d1939SAndy Fiddaman 	ssize_t	match[2];
194da2e3ebdSchin 
195da2e3ebdSchin 	return strgrpmatch(s, p, match, 1, (flags ? STR_MAXIMAL : 0)|STR_LEFT) ? (char*)s + match[1] : (char*)0;
196da2e3ebdSchin }
197*b30d1939SAndy Fiddaman 
198*b30d1939SAndy Fiddaman #undef	strgrpmatch
199*b30d1939SAndy Fiddaman #if _map_libc
200*b30d1939SAndy Fiddaman #define strgrpmatch	_ast_strgrpmatch
201*b30d1939SAndy Fiddaman #endif
202*b30d1939SAndy Fiddaman 
203*b30d1939SAndy Fiddaman int
strgrpmatch(const char * b,const char * p,int * sub,int n,int flags)204*b30d1939SAndy Fiddaman strgrpmatch(const char* b, const char* p, int* sub, int n, int flags)
205*b30d1939SAndy Fiddaman {
206*b30d1939SAndy Fiddaman 	return strgrpmatch_20120528(b, p, (ssize_t*)sub, n, flags|STR_INT);
207*b30d1939SAndy Fiddaman }
208