xref: /illumos-gate/usr/src/lib/libzpool/common/kernel.c (revision 5ad820458efd0fdb914baff9c1447c22b819fa23)
1fa9e4066Sahrens /*
2fa9e4066Sahrens  * CDDL HEADER START
3fa9e4066Sahrens  *
4fa9e4066Sahrens  * The contents of this file are subject to the terms of the
5ea8dc4b6Seschrock  * Common Development and Distribution License (the "License").
6ea8dc4b6Seschrock  * You may not use this file except in compliance with the License.
7fa9e4066Sahrens  *
8fa9e4066Sahrens  * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE
9fa9e4066Sahrens  * or http://www.opensolaris.org/os/licensing.
10fa9e4066Sahrens  * See the License for the specific language governing permissions
11fa9e4066Sahrens  * and limitations under the License.
12fa9e4066Sahrens  *
13fa9e4066Sahrens  * When distributing Covered Code, include this CDDL HEADER in each
14fa9e4066Sahrens  * file and include the License file at usr/src/OPENSOLARIS.LICENSE.
15fa9e4066Sahrens  * If applicable, add the following below this CDDL HEADER, with the
16fa9e4066Sahrens  * fields enclosed by brackets "[]" replaced with your own identifying
17fa9e4066Sahrens  * information: Portions Copyright [yyyy] [name of copyright owner]
18fa9e4066Sahrens  *
19fa9e4066Sahrens  * CDDL HEADER END
20fa9e4066Sahrens  */
21fa9e4066Sahrens /*
22ea8dc4b6Seschrock  * Copyright 2006 Sun Microsystems, Inc.  All rights reserved.
23fa9e4066Sahrens  * Use is subject to license terms.
24fa9e4066Sahrens  */
25fa9e4066Sahrens 
26fa9e4066Sahrens #pragma ident	"%Z%%M%	%I%	%E% SMI"
27fa9e4066Sahrens 
28fa9e4066Sahrens #include <assert.h>
29fa9e4066Sahrens #include <sys/zfs_context.h>
30fa9e4066Sahrens #include <poll.h>
31fa9e4066Sahrens #include <string.h>
32fa9e4066Sahrens #include <stdio.h>
33fa9e4066Sahrens #include <stdlib.h>
34fa9e4066Sahrens #include <fcntl.h>
35fa9e4066Sahrens #include <sys/stat.h>
36fa9e4066Sahrens #include <sys/spa.h>
37fa9e4066Sahrens #include <sys/processor.h>
38fa9e4066Sahrens 
39*5ad82045Snd 
40fa9e4066Sahrens /*
41fa9e4066Sahrens  * Emulation of kernel services in userland.
42fa9e4066Sahrens  */
43fa9e4066Sahrens 
44fa9e4066Sahrens uint64_t physmem;
45fa9e4066Sahrens vnode_t *rootdir = (vnode_t *)0xabcd1234;
46fa9e4066Sahrens 
47fa9e4066Sahrens /*
48fa9e4066Sahrens  * =========================================================================
49fa9e4066Sahrens  * threads
50fa9e4066Sahrens  * =========================================================================
51fa9e4066Sahrens  */
52fa9e4066Sahrens /*ARGSUSED*/
53fa9e4066Sahrens kthread_t *
54fa9e4066Sahrens zk_thread_create(void (*func)(), void *arg)
55fa9e4066Sahrens {
56fa9e4066Sahrens 	thread_t tid;
57fa9e4066Sahrens 
58fa9e4066Sahrens 	VERIFY(thr_create(0, 0, (void *(*)(void *))func, arg, THR_DETACHED,
59fa9e4066Sahrens 	    &tid) == 0);
60fa9e4066Sahrens 
61fa9e4066Sahrens 	return ((void *)(uintptr_t)tid);
62fa9e4066Sahrens }
63fa9e4066Sahrens 
64fa9e4066Sahrens /*
65fa9e4066Sahrens  * =========================================================================
66fa9e4066Sahrens  * mutexes
67fa9e4066Sahrens  * =========================================================================
68fa9e4066Sahrens  */
69fa9e4066Sahrens void
70fa9e4066Sahrens zmutex_init(kmutex_t *mp)
71fa9e4066Sahrens {
72fa9e4066Sahrens 	mp->m_owner = NULL;
73fa9e4066Sahrens 	(void) _mutex_init(&mp->m_lock, USYNC_THREAD, NULL);
74fa9e4066Sahrens }
75fa9e4066Sahrens 
76fa9e4066Sahrens void
77fa9e4066Sahrens zmutex_destroy(kmutex_t *mp)
78fa9e4066Sahrens {
79fa9e4066Sahrens 	ASSERT(mp->m_owner == NULL);
80fa9e4066Sahrens 	(void) _mutex_destroy(&(mp)->m_lock);
81fa9e4066Sahrens 	mp->m_owner = (void *)-1UL;
82fa9e4066Sahrens }
83fa9e4066Sahrens 
84fa9e4066Sahrens void
85fa9e4066Sahrens mutex_enter(kmutex_t *mp)
86fa9e4066Sahrens {
87fa9e4066Sahrens 	ASSERT(mp->m_owner != (void *)-1UL);
88fa9e4066Sahrens 	ASSERT(mp->m_owner != curthread);
89*5ad82045Snd 	VERIFY(mutex_lock(&mp->m_lock) == 0);
90fa9e4066Sahrens 	ASSERT(mp->m_owner == NULL);
91fa9e4066Sahrens 	mp->m_owner = curthread;
92fa9e4066Sahrens }
93fa9e4066Sahrens 
94fa9e4066Sahrens int
95fa9e4066Sahrens mutex_tryenter(kmutex_t *mp)
96fa9e4066Sahrens {
97fa9e4066Sahrens 	ASSERT(mp->m_owner != (void *)-1UL);
98fa9e4066Sahrens 	if (0 == mutex_trylock(&mp->m_lock)) {
99fa9e4066Sahrens 		ASSERT(mp->m_owner == NULL);
100fa9e4066Sahrens 		mp->m_owner = curthread;
101fa9e4066Sahrens 		return (1);
102fa9e4066Sahrens 	} else {
103fa9e4066Sahrens 		return (0);
104fa9e4066Sahrens 	}
105fa9e4066Sahrens }
106fa9e4066Sahrens 
107fa9e4066Sahrens void
108fa9e4066Sahrens mutex_exit(kmutex_t *mp)
109fa9e4066Sahrens {
110fa9e4066Sahrens 	ASSERT(mutex_owner(mp) == curthread);
111fa9e4066Sahrens 	mp->m_owner = NULL;
112*5ad82045Snd 	VERIFY(mutex_unlock(&mp->m_lock) == 0);
113fa9e4066Sahrens }
114fa9e4066Sahrens 
115fa9e4066Sahrens void *
116fa9e4066Sahrens mutex_owner(kmutex_t *mp)
117fa9e4066Sahrens {
118fa9e4066Sahrens 	return (mp->m_owner);
119fa9e4066Sahrens }
120fa9e4066Sahrens 
121fa9e4066Sahrens /*
122fa9e4066Sahrens  * =========================================================================
123fa9e4066Sahrens  * rwlocks
124fa9e4066Sahrens  * =========================================================================
125fa9e4066Sahrens  */
126fa9e4066Sahrens /*ARGSUSED*/
127fa9e4066Sahrens void
128fa9e4066Sahrens rw_init(krwlock_t *rwlp, char *name, int type, void *arg)
129fa9e4066Sahrens {
130fa9e4066Sahrens 	rwlock_init(&rwlp->rw_lock, USYNC_THREAD, NULL);
131fa9e4066Sahrens 	rwlp->rw_owner = NULL;
132fa9e4066Sahrens }
133fa9e4066Sahrens 
134fa9e4066Sahrens void
135fa9e4066Sahrens rw_destroy(krwlock_t *rwlp)
136fa9e4066Sahrens {
137fa9e4066Sahrens 	rwlock_destroy(&rwlp->rw_lock);
138fa9e4066Sahrens 	rwlp->rw_owner = (void *)-1UL;
139fa9e4066Sahrens }
140fa9e4066Sahrens 
141fa9e4066Sahrens void
142fa9e4066Sahrens rw_enter(krwlock_t *rwlp, krw_t rw)
143fa9e4066Sahrens {
144fa9e4066Sahrens 	ASSERT(!RW_LOCK_HELD(rwlp));
145fa9e4066Sahrens 	ASSERT(rwlp->rw_owner != (void *)-1UL);
146fa9e4066Sahrens 	ASSERT(rwlp->rw_owner != curthread);
147fa9e4066Sahrens 
148fa9e4066Sahrens 	if (rw == RW_READER)
149fa9e4066Sahrens 		(void) rw_rdlock(&rwlp->rw_lock);
150fa9e4066Sahrens 	else
151fa9e4066Sahrens 		(void) rw_wrlock(&rwlp->rw_lock);
152fa9e4066Sahrens 
153fa9e4066Sahrens 	rwlp->rw_owner = curthread;
154fa9e4066Sahrens }
155fa9e4066Sahrens 
156fa9e4066Sahrens void
157fa9e4066Sahrens rw_exit(krwlock_t *rwlp)
158fa9e4066Sahrens {
159fa9e4066Sahrens 	ASSERT(rwlp->rw_owner != (void *)-1UL);
160fa9e4066Sahrens 
161fa9e4066Sahrens 	rwlp->rw_owner = NULL;
162fa9e4066Sahrens 	(void) rw_unlock(&rwlp->rw_lock);
163fa9e4066Sahrens }
164fa9e4066Sahrens 
165fa9e4066Sahrens int
166fa9e4066Sahrens rw_tryenter(krwlock_t *rwlp, krw_t rw)
167fa9e4066Sahrens {
168fa9e4066Sahrens 	int rv;
169fa9e4066Sahrens 
170fa9e4066Sahrens 	ASSERT(rwlp->rw_owner != (void *)-1UL);
171fa9e4066Sahrens 
172fa9e4066Sahrens 	if (rw == RW_READER)
173fa9e4066Sahrens 		rv = rw_tryrdlock(&rwlp->rw_lock);
174fa9e4066Sahrens 	else
175fa9e4066Sahrens 		rv = rw_trywrlock(&rwlp->rw_lock);
176fa9e4066Sahrens 
177fa9e4066Sahrens 	if (rv == 0) {
178fa9e4066Sahrens 		rwlp->rw_owner = curthread;
179fa9e4066Sahrens 		return (1);
180fa9e4066Sahrens 	}
181fa9e4066Sahrens 
182fa9e4066Sahrens 	return (0);
183fa9e4066Sahrens }
184fa9e4066Sahrens 
185fa9e4066Sahrens /*ARGSUSED*/
186fa9e4066Sahrens int
187fa9e4066Sahrens rw_tryupgrade(krwlock_t *rwlp)
188fa9e4066Sahrens {
189fa9e4066Sahrens 	ASSERT(rwlp->rw_owner != (void *)-1UL);
190fa9e4066Sahrens 
191fa9e4066Sahrens 	return (0);
192fa9e4066Sahrens }
193fa9e4066Sahrens 
194fa9e4066Sahrens /*
195fa9e4066Sahrens  * =========================================================================
196fa9e4066Sahrens  * condition variables
197fa9e4066Sahrens  * =========================================================================
198fa9e4066Sahrens  */
199fa9e4066Sahrens /*ARGSUSED*/
200fa9e4066Sahrens void
201fa9e4066Sahrens cv_init(kcondvar_t *cv, char *name, int type, void *arg)
202fa9e4066Sahrens {
203*5ad82045Snd 	VERIFY(cond_init(cv, type, NULL) == 0);
204fa9e4066Sahrens }
205fa9e4066Sahrens 
206fa9e4066Sahrens void
207fa9e4066Sahrens cv_destroy(kcondvar_t *cv)
208fa9e4066Sahrens {
209*5ad82045Snd 	VERIFY(cond_destroy(cv) == 0);
210fa9e4066Sahrens }
211fa9e4066Sahrens 
212fa9e4066Sahrens void
213fa9e4066Sahrens cv_wait(kcondvar_t *cv, kmutex_t *mp)
214fa9e4066Sahrens {
215fa9e4066Sahrens 	ASSERT(mutex_owner(mp) == curthread);
216fa9e4066Sahrens 	mp->m_owner = NULL;
217*5ad82045Snd 	int ret = cond_wait(cv, &mp->m_lock);
218*5ad82045Snd 	VERIFY(ret == 0 || ret == EINTR);
219fa9e4066Sahrens 	mp->m_owner = curthread;
220fa9e4066Sahrens }
221fa9e4066Sahrens 
222fa9e4066Sahrens clock_t
223fa9e4066Sahrens cv_timedwait(kcondvar_t *cv, kmutex_t *mp, clock_t abstime)
224fa9e4066Sahrens {
225fa9e4066Sahrens 	int error;
226fa9e4066Sahrens 	timestruc_t ts;
227fa9e4066Sahrens 	clock_t delta;
228fa9e4066Sahrens 
229fa9e4066Sahrens top:
230fa9e4066Sahrens 	delta = abstime - lbolt;
231fa9e4066Sahrens 	if (delta <= 0)
232fa9e4066Sahrens 		return (-1);
233fa9e4066Sahrens 
234fa9e4066Sahrens 	ts.tv_sec = delta / hz;
235fa9e4066Sahrens 	ts.tv_nsec = (delta % hz) * (NANOSEC / hz);
236fa9e4066Sahrens 
237fa9e4066Sahrens 	ASSERT(mutex_owner(mp) == curthread);
238fa9e4066Sahrens 	mp->m_owner = NULL;
239fa9e4066Sahrens 	error = cond_reltimedwait(cv, &mp->m_lock, &ts);
240fa9e4066Sahrens 	mp->m_owner = curthread;
241fa9e4066Sahrens 
242fa9e4066Sahrens 	if (error == ETIME)
243fa9e4066Sahrens 		return (-1);
244fa9e4066Sahrens 
245fa9e4066Sahrens 	if (error == EINTR)
246fa9e4066Sahrens 		goto top;
247fa9e4066Sahrens 
248fa9e4066Sahrens 	ASSERT(error == 0);
249fa9e4066Sahrens 
250fa9e4066Sahrens 	return (1);
251fa9e4066Sahrens }
252fa9e4066Sahrens 
253fa9e4066Sahrens void
254fa9e4066Sahrens cv_signal(kcondvar_t *cv)
255fa9e4066Sahrens {
256*5ad82045Snd 	VERIFY(cond_signal(cv) == 0);
257fa9e4066Sahrens }
258fa9e4066Sahrens 
259fa9e4066Sahrens void
260fa9e4066Sahrens cv_broadcast(kcondvar_t *cv)
261fa9e4066Sahrens {
262*5ad82045Snd 	VERIFY(cond_broadcast(cv) == 0);
263fa9e4066Sahrens }
264fa9e4066Sahrens 
265fa9e4066Sahrens /*
266fa9e4066Sahrens  * =========================================================================
267fa9e4066Sahrens  * vnode operations
268fa9e4066Sahrens  * =========================================================================
269fa9e4066Sahrens  */
270fa9e4066Sahrens /*
271fa9e4066Sahrens  * Note: for the xxxat() versions of these functions, we assume that the
272fa9e4066Sahrens  * starting vp is always rootdir (which is true for spa_directory.c, the only
273fa9e4066Sahrens  * ZFS consumer of these interfaces).  We assert this is true, and then emulate
274fa9e4066Sahrens  * them by adding '/' in front of the path.
275fa9e4066Sahrens  */
276fa9e4066Sahrens 
277fa9e4066Sahrens /*ARGSUSED*/
278fa9e4066Sahrens int
279fa9e4066Sahrens vn_open(char *path, int x1, int flags, int mode, vnode_t **vpp, int x2, int x3)
280fa9e4066Sahrens {
281fa9e4066Sahrens 	int fd;
282fa9e4066Sahrens 	vnode_t *vp;
283fa9e4066Sahrens 	int old_umask;
284fa9e4066Sahrens 	char realpath[MAXPATHLEN];
285fa9e4066Sahrens 	struct stat64 st;
286fa9e4066Sahrens 
287fa9e4066Sahrens 	/*
288fa9e4066Sahrens 	 * If we're accessing a real disk from userland, we need to use
289fa9e4066Sahrens 	 * the character interface to avoid caching.  This is particularly
290fa9e4066Sahrens 	 * important if we're trying to look at a real in-kernel storage
291fa9e4066Sahrens 	 * pool from userland, e.g. via zdb, because otherwise we won't
292fa9e4066Sahrens 	 * see the changes occurring under the segmap cache.
293fa9e4066Sahrens 	 * On the other hand, the stupid character device returns zero
294fa9e4066Sahrens 	 * for its size.  So -- gag -- we open the block device to get
295fa9e4066Sahrens 	 * its size, and remember it for subsequent VOP_GETATTR().
296fa9e4066Sahrens 	 */
297fa9e4066Sahrens 	if (strncmp(path, "/dev/", 5) == 0) {
298fa9e4066Sahrens 		char *dsk;
299fa9e4066Sahrens 		fd = open64(path, O_RDONLY);
300fa9e4066Sahrens 		if (fd == -1)
301fa9e4066Sahrens 			return (errno);
302fa9e4066Sahrens 		if (fstat64(fd, &st) == -1) {
303fa9e4066Sahrens 			close(fd);
304fa9e4066Sahrens 			return (errno);
305fa9e4066Sahrens 		}
306fa9e4066Sahrens 		close(fd);
307fa9e4066Sahrens 		(void) sprintf(realpath, "%s", path);
308fa9e4066Sahrens 		dsk = strstr(path, "/dsk/");
309fa9e4066Sahrens 		if (dsk != NULL)
310fa9e4066Sahrens 			(void) sprintf(realpath + (dsk - path) + 1, "r%s",
311fa9e4066Sahrens 			    dsk + 1);
312fa9e4066Sahrens 	} else {
313fa9e4066Sahrens 		(void) sprintf(realpath, "%s", path);
314fa9e4066Sahrens 		if (!(flags & FCREAT) && stat64(realpath, &st) == -1)
315fa9e4066Sahrens 			return (errno);
316fa9e4066Sahrens 	}
317fa9e4066Sahrens 
318fa9e4066Sahrens 	if (flags & FCREAT)
319fa9e4066Sahrens 		old_umask = umask(0);
320fa9e4066Sahrens 
321fa9e4066Sahrens 	/*
322fa9e4066Sahrens 	 * The construct 'flags - FREAD' conveniently maps combinations of
323fa9e4066Sahrens 	 * FREAD and FWRITE to the corresponding O_RDONLY, O_WRONLY, and O_RDWR.
324fa9e4066Sahrens 	 */
325fa9e4066Sahrens 	fd = open64(realpath, flags - FREAD, mode);
326fa9e4066Sahrens 
327fa9e4066Sahrens 	if (flags & FCREAT)
328fa9e4066Sahrens 		(void) umask(old_umask);
329fa9e4066Sahrens 
330fa9e4066Sahrens 	if (fd == -1)
331fa9e4066Sahrens 		return (errno);
332fa9e4066Sahrens 
333fa9e4066Sahrens 	if (fstat64(fd, &st) == -1) {
334fa9e4066Sahrens 		close(fd);
335fa9e4066Sahrens 		return (errno);
336fa9e4066Sahrens 	}
337fa9e4066Sahrens 
338fa9e4066Sahrens 	(void) fcntl(fd, F_SETFD, FD_CLOEXEC);
339fa9e4066Sahrens 
340fa9e4066Sahrens 	*vpp = vp = umem_zalloc(sizeof (vnode_t), UMEM_NOFAIL);
341fa9e4066Sahrens 
342fa9e4066Sahrens 	vp->v_fd = fd;
343fa9e4066Sahrens 	vp->v_size = st.st_size;
344fa9e4066Sahrens 	vp->v_path = spa_strdup(path);
345fa9e4066Sahrens 
346fa9e4066Sahrens 	return (0);
347fa9e4066Sahrens }
348fa9e4066Sahrens 
349fa9e4066Sahrens int
350fa9e4066Sahrens vn_openat(char *path, int x1, int flags, int mode, vnode_t **vpp, int x2,
351fa9e4066Sahrens     int x3, vnode_t *startvp)
352fa9e4066Sahrens {
353fa9e4066Sahrens 	char *realpath = umem_alloc(strlen(path) + 2, UMEM_NOFAIL);
354fa9e4066Sahrens 	int ret;
355fa9e4066Sahrens 
356fa9e4066Sahrens 	ASSERT(startvp == rootdir);
357fa9e4066Sahrens 	(void) sprintf(realpath, "/%s", path);
358fa9e4066Sahrens 
359fa9e4066Sahrens 	ret = vn_open(realpath, x1, flags, mode, vpp, x2, x3);
360fa9e4066Sahrens 
361fa9e4066Sahrens 	umem_free(realpath, strlen(path) + 2);
362fa9e4066Sahrens 
363fa9e4066Sahrens 	return (ret);
364fa9e4066Sahrens }
365fa9e4066Sahrens 
366fa9e4066Sahrens /*ARGSUSED*/
367fa9e4066Sahrens int
368fa9e4066Sahrens vn_rdwr(int uio, vnode_t *vp, void *addr, ssize_t len, offset_t offset,
369fa9e4066Sahrens 	int x1, int x2, rlim64_t x3, void *x4, ssize_t *residp)
370fa9e4066Sahrens {
371fa9e4066Sahrens 	ssize_t iolen, split;
372fa9e4066Sahrens 
373fa9e4066Sahrens 	if (uio == UIO_READ) {
374fa9e4066Sahrens 		iolen = pread64(vp->v_fd, addr, len, offset);
375fa9e4066Sahrens 	} else {
376fa9e4066Sahrens 		/*
377fa9e4066Sahrens 		 * To simulate partial disk writes, we split writes into two
378fa9e4066Sahrens 		 * system calls so that the process can be killed in between.
379fa9e4066Sahrens 		 */
380fa9e4066Sahrens 		split = (len > 0 ? rand() % len : 0);
381fa9e4066Sahrens 		iolen = pwrite64(vp->v_fd, addr, split, offset);
382fa9e4066Sahrens 		iolen += pwrite64(vp->v_fd, (char *)addr + split,
383fa9e4066Sahrens 		    len - split, offset + split);
384fa9e4066Sahrens 	}
385fa9e4066Sahrens 
386fa9e4066Sahrens 	if (iolen == -1)
387fa9e4066Sahrens 		return (errno);
388fa9e4066Sahrens 	if (residp)
389fa9e4066Sahrens 		*residp = len - iolen;
390fa9e4066Sahrens 	else if (iolen != len)
391fa9e4066Sahrens 		return (EIO);
392fa9e4066Sahrens 	return (0);
393fa9e4066Sahrens }
394fa9e4066Sahrens 
395fa9e4066Sahrens void
396fa9e4066Sahrens vn_close(vnode_t *vp)
397fa9e4066Sahrens {
398fa9e4066Sahrens 	close(vp->v_fd);
399fa9e4066Sahrens 	spa_strfree(vp->v_path);
400fa9e4066Sahrens 	umem_free(vp, sizeof (vnode_t));
401fa9e4066Sahrens }
402fa9e4066Sahrens 
403fa9e4066Sahrens #ifdef ZFS_DEBUG
404fa9e4066Sahrens 
405fa9e4066Sahrens /*
406fa9e4066Sahrens  * =========================================================================
407fa9e4066Sahrens  * Figure out which debugging statements to print
408fa9e4066Sahrens  * =========================================================================
409fa9e4066Sahrens  */
410fa9e4066Sahrens 
411fa9e4066Sahrens static char *dprintf_string;
412fa9e4066Sahrens static int dprintf_print_all;
413fa9e4066Sahrens 
414fa9e4066Sahrens int
415fa9e4066Sahrens dprintf_find_string(const char *string)
416fa9e4066Sahrens {
417fa9e4066Sahrens 	char *tmp_str = dprintf_string;
418fa9e4066Sahrens 	int len = strlen(string);
419fa9e4066Sahrens 
420fa9e4066Sahrens 	/*
421fa9e4066Sahrens 	 * Find out if this is a string we want to print.
422fa9e4066Sahrens 	 * String format: file1.c,function_name1,file2.c,file3.c
423fa9e4066Sahrens 	 */
424fa9e4066Sahrens 
425fa9e4066Sahrens 	while (tmp_str != NULL) {
426fa9e4066Sahrens 		if (strncmp(tmp_str, string, len) == 0 &&
427fa9e4066Sahrens 		    (tmp_str[len] == ',' || tmp_str[len] == '\0'))
428fa9e4066Sahrens 			return (1);
429fa9e4066Sahrens 		tmp_str = strchr(tmp_str, ',');
430fa9e4066Sahrens 		if (tmp_str != NULL)
431fa9e4066Sahrens 			tmp_str++; /* Get rid of , */
432fa9e4066Sahrens 	}
433fa9e4066Sahrens 	return (0);
434fa9e4066Sahrens }
435fa9e4066Sahrens 
436fa9e4066Sahrens void
437fa9e4066Sahrens dprintf_setup(int *argc, char **argv)
438fa9e4066Sahrens {
439fa9e4066Sahrens 	int i, j;
440fa9e4066Sahrens 
441fa9e4066Sahrens 	/*
442fa9e4066Sahrens 	 * Debugging can be specified two ways: by setting the
443fa9e4066Sahrens 	 * environment variable ZFS_DEBUG, or by including a
444fa9e4066Sahrens 	 * "debug=..."  argument on the command line.  The command
445fa9e4066Sahrens 	 * line setting overrides the environment variable.
446fa9e4066Sahrens 	 */
447fa9e4066Sahrens 
448fa9e4066Sahrens 	for (i = 1; i < *argc; i++) {
449fa9e4066Sahrens 		int len = strlen("debug=");
450fa9e4066Sahrens 		/* First look for a command line argument */
451fa9e4066Sahrens 		if (strncmp("debug=", argv[i], len) == 0) {
452fa9e4066Sahrens 			dprintf_string = argv[i] + len;
453fa9e4066Sahrens 			/* Remove from args */
454fa9e4066Sahrens 			for (j = i; j < *argc; j++)
455fa9e4066Sahrens 				argv[j] = argv[j+1];
456fa9e4066Sahrens 			argv[j] = NULL;
457fa9e4066Sahrens 			(*argc)--;
458fa9e4066Sahrens 		}
459fa9e4066Sahrens 	}
460fa9e4066Sahrens 
461fa9e4066Sahrens 	if (dprintf_string == NULL) {
462fa9e4066Sahrens 		/* Look for ZFS_DEBUG environment variable */
463fa9e4066Sahrens 		dprintf_string = getenv("ZFS_DEBUG");
464fa9e4066Sahrens 	}
465fa9e4066Sahrens 
466fa9e4066Sahrens 	/*
467fa9e4066Sahrens 	 * Are we just turning on all debugging?
468fa9e4066Sahrens 	 */
469fa9e4066Sahrens 	if (dprintf_find_string("on"))
470fa9e4066Sahrens 		dprintf_print_all = 1;
471fa9e4066Sahrens }
472fa9e4066Sahrens 
473fa9e4066Sahrens /*
474fa9e4066Sahrens  * =========================================================================
475fa9e4066Sahrens  * debug printfs
476fa9e4066Sahrens  * =========================================================================
477fa9e4066Sahrens  */
478fa9e4066Sahrens void
479fa9e4066Sahrens __dprintf(const char *file, const char *func, int line, const char *fmt, ...)
480fa9e4066Sahrens {
481fa9e4066Sahrens 	const char *newfile;
482fa9e4066Sahrens 	va_list adx;
483fa9e4066Sahrens 
484fa9e4066Sahrens 	/*
485fa9e4066Sahrens 	 * Get rid of annoying "../common/" prefix to filename.
486fa9e4066Sahrens 	 */
487fa9e4066Sahrens 	newfile = strrchr(file, '/');
488fa9e4066Sahrens 	if (newfile != NULL) {
489fa9e4066Sahrens 		newfile = newfile + 1; /* Get rid of leading / */
490fa9e4066Sahrens 	} else {
491fa9e4066Sahrens 		newfile = file;
492fa9e4066Sahrens 	}
493fa9e4066Sahrens 
494fa9e4066Sahrens 	if (dprintf_print_all ||
495fa9e4066Sahrens 	    dprintf_find_string(newfile) ||
496fa9e4066Sahrens 	    dprintf_find_string(func)) {
497fa9e4066Sahrens 		/* Print out just the function name if requested */
498fa9e4066Sahrens 		flockfile(stdout);
499fa9e4066Sahrens 		if (dprintf_find_string("pid"))
500fa9e4066Sahrens 			(void) printf("%d ", getpid());
501fa9e4066Sahrens 		if (dprintf_find_string("tid"))
502fa9e4066Sahrens 			(void) printf("%u ", thr_self());
503fa9e4066Sahrens 		if (dprintf_find_string("cpu"))
504fa9e4066Sahrens 			(void) printf("%u ", getcpuid());
505fa9e4066Sahrens 		if (dprintf_find_string("time"))
506fa9e4066Sahrens 			(void) printf("%llu ", gethrtime());
507fa9e4066Sahrens 		if (dprintf_find_string("long"))
508fa9e4066Sahrens 			(void) printf("%s, line %d: ", newfile, line);
509fa9e4066Sahrens 		(void) printf("%s: ", func);
510fa9e4066Sahrens 		va_start(adx, fmt);
511fa9e4066Sahrens 		(void) vprintf(fmt, adx);
512fa9e4066Sahrens 		va_end(adx);
513fa9e4066Sahrens 		funlockfile(stdout);
514fa9e4066Sahrens 	}
515fa9e4066Sahrens }
516fa9e4066Sahrens 
517fa9e4066Sahrens #endif /* ZFS_DEBUG */
518fa9e4066Sahrens 
519fa9e4066Sahrens /*
520fa9e4066Sahrens  * =========================================================================
521fa9e4066Sahrens  * cmn_err() and panic()
522fa9e4066Sahrens  * =========================================================================
523fa9e4066Sahrens  */
524fa9e4066Sahrens static char ce_prefix[CE_IGNORE][10] = { "", "NOTICE: ", "WARNING: ", "" };
525fa9e4066Sahrens static char ce_suffix[CE_IGNORE][2] = { "", "\n", "\n", "" };
526fa9e4066Sahrens 
527fa9e4066Sahrens void
528fa9e4066Sahrens vpanic(const char *fmt, va_list adx)
529fa9e4066Sahrens {
530fa9e4066Sahrens 	(void) fprintf(stderr, "error: ");
531fa9e4066Sahrens 	(void) vfprintf(stderr, fmt, adx);
532fa9e4066Sahrens 	(void) fprintf(stderr, "\n");
533fa9e4066Sahrens 
534fa9e4066Sahrens 	abort();	/* think of it as a "user-level crash dump" */
535fa9e4066Sahrens }
536fa9e4066Sahrens 
537fa9e4066Sahrens void
538fa9e4066Sahrens panic(const char *fmt, ...)
539fa9e4066Sahrens {
540fa9e4066Sahrens 	va_list adx;
541fa9e4066Sahrens 
542fa9e4066Sahrens 	va_start(adx, fmt);
543fa9e4066Sahrens 	vpanic(fmt, adx);
544fa9e4066Sahrens 	va_end(adx);
545fa9e4066Sahrens }
546fa9e4066Sahrens 
547fa9e4066Sahrens /*PRINTFLIKE2*/
548fa9e4066Sahrens void
549fa9e4066Sahrens cmn_err(int ce, const char *fmt, ...)
550fa9e4066Sahrens {
551fa9e4066Sahrens 	va_list adx;
552fa9e4066Sahrens 
553fa9e4066Sahrens 	va_start(adx, fmt);
554fa9e4066Sahrens 	if (ce == CE_PANIC)
555fa9e4066Sahrens 		vpanic(fmt, adx);
556fa9e4066Sahrens 	if (ce != CE_NOTE) {	/* suppress noise in userland stress testing */
557fa9e4066Sahrens 		(void) fprintf(stderr, "%s", ce_prefix[ce]);
558fa9e4066Sahrens 		(void) vfprintf(stderr, fmt, adx);
559fa9e4066Sahrens 		(void) fprintf(stderr, "%s", ce_suffix[ce]);
560fa9e4066Sahrens 	}
561fa9e4066Sahrens 	va_end(adx);
562fa9e4066Sahrens }
563fa9e4066Sahrens 
564ea8dc4b6Seschrock /*
565ea8dc4b6Seschrock  * =========================================================================
566ea8dc4b6Seschrock  * kobj interfaces
567ea8dc4b6Seschrock  * =========================================================================
568ea8dc4b6Seschrock  */
569ea8dc4b6Seschrock struct _buf *
570ea8dc4b6Seschrock kobj_open_file(char *name)
571ea8dc4b6Seschrock {
572ea8dc4b6Seschrock 	struct _buf *file;
573ea8dc4b6Seschrock 	vnode_t *vp;
574ea8dc4b6Seschrock 
575ea8dc4b6Seschrock 	/* set vp as the _fd field of the file */
576ea8dc4b6Seschrock 	if (vn_openat(name, UIO_SYSSPACE, FREAD, 0, &vp, 0, 0, rootdir) != 0)
577ea8dc4b6Seschrock 		return ((void *)-1UL);
578ea8dc4b6Seschrock 
579ea8dc4b6Seschrock 	file = umem_zalloc(sizeof (struct _buf), UMEM_NOFAIL);
580ea8dc4b6Seschrock 	file->_fd = (intptr_t)vp;
581ea8dc4b6Seschrock 	return (file);
582ea8dc4b6Seschrock }
583ea8dc4b6Seschrock 
584ea8dc4b6Seschrock int
585ea8dc4b6Seschrock kobj_read_file(struct _buf *file, char *buf, unsigned size, unsigned off)
586ea8dc4b6Seschrock {
587ea8dc4b6Seschrock 	ssize_t resid;
588ea8dc4b6Seschrock 
589ea8dc4b6Seschrock 	vn_rdwr(UIO_READ, (vnode_t *)file->_fd, buf, size, (offset_t)off,
590ea8dc4b6Seschrock 	    UIO_SYSSPACE, 0, 0, 0, &resid);
591ea8dc4b6Seschrock 
592ea8dc4b6Seschrock 	return (0);
593ea8dc4b6Seschrock }
594ea8dc4b6Seschrock 
595ea8dc4b6Seschrock void
596ea8dc4b6Seschrock kobj_close_file(struct _buf *file)
597ea8dc4b6Seschrock {
598ea8dc4b6Seschrock 	vn_close((vnode_t *)file->_fd);
599ea8dc4b6Seschrock 	umem_free(file, sizeof (struct _buf));
600ea8dc4b6Seschrock }
601ea8dc4b6Seschrock 
602ea8dc4b6Seschrock int
603ea8dc4b6Seschrock kobj_fstat(intptr_t fd, struct bootstat *bst)
604ea8dc4b6Seschrock {
605ea8dc4b6Seschrock 	struct stat64 st;
606ea8dc4b6Seschrock 	vnode_t *vp = (vnode_t *)fd;
607ea8dc4b6Seschrock 	if (fstat64(vp->v_fd, &st) == -1) {
608ea8dc4b6Seschrock 		vn_close(vp);
609ea8dc4b6Seschrock 		return (errno);
610ea8dc4b6Seschrock 	}
611ea8dc4b6Seschrock 	bst->st_size = (uint64_t)st.st_size;
612ea8dc4b6Seschrock 	return (0);
613ea8dc4b6Seschrock }
614ea8dc4b6Seschrock 
615fa9e4066Sahrens /*
616fa9e4066Sahrens  * =========================================================================
617fa9e4066Sahrens  * misc routines
618fa9e4066Sahrens  * =========================================================================
619fa9e4066Sahrens  */
620fa9e4066Sahrens 
621fa9e4066Sahrens void
622fa9e4066Sahrens delay(clock_t ticks)
623fa9e4066Sahrens {
624fa9e4066Sahrens 	poll(0, 0, ticks * (1000 / hz));
625fa9e4066Sahrens }
626fa9e4066Sahrens 
627fa9e4066Sahrens /*
628fa9e4066Sahrens  * Find highest one bit set.
629fa9e4066Sahrens  *	Returns bit number + 1 of highest bit that is set, otherwise returns 0.
630fa9e4066Sahrens  * High order bit is 31 (or 63 in _LP64 kernel).
631fa9e4066Sahrens  */
632fa9e4066Sahrens int
633fa9e4066Sahrens highbit(ulong_t i)
634fa9e4066Sahrens {
635fa9e4066Sahrens 	register int h = 1;
636fa9e4066Sahrens 
637fa9e4066Sahrens 	if (i == 0)
638fa9e4066Sahrens 		return (0);
639fa9e4066Sahrens #ifdef _LP64
640fa9e4066Sahrens 	if (i & 0xffffffff00000000ul) {
641fa9e4066Sahrens 		h += 32; i >>= 32;
642fa9e4066Sahrens 	}
643fa9e4066Sahrens #endif
644fa9e4066Sahrens 	if (i & 0xffff0000) {
645fa9e4066Sahrens 		h += 16; i >>= 16;
646fa9e4066Sahrens 	}
647fa9e4066Sahrens 	if (i & 0xff00) {
648fa9e4066Sahrens 		h += 8; i >>= 8;
649fa9e4066Sahrens 	}
650fa9e4066Sahrens 	if (i & 0xf0) {
651fa9e4066Sahrens 		h += 4; i >>= 4;
652fa9e4066Sahrens 	}
653fa9e4066Sahrens 	if (i & 0xc) {
654fa9e4066Sahrens 		h += 2; i >>= 2;
655fa9e4066Sahrens 	}
656fa9e4066Sahrens 	if (i & 0x2) {
657fa9e4066Sahrens 		h += 1;
658fa9e4066Sahrens 	}
659fa9e4066Sahrens 	return (h);
660fa9e4066Sahrens }
661fa9e4066Sahrens 
662fa9e4066Sahrens static int
663fa9e4066Sahrens random_get_bytes_common(uint8_t *ptr, size_t len, char *devname)
664fa9e4066Sahrens {
665fa9e4066Sahrens 	int fd = open(devname, O_RDONLY);
666fa9e4066Sahrens 	size_t resid = len;
667fa9e4066Sahrens 	ssize_t bytes;
668fa9e4066Sahrens 
669fa9e4066Sahrens 	ASSERT(fd != -1);
670fa9e4066Sahrens 
671fa9e4066Sahrens 	while (resid != 0) {
672fa9e4066Sahrens 		bytes = read(fd, ptr, resid);
673fa9e4066Sahrens 		ASSERT(bytes >= 0);
674fa9e4066Sahrens 		ptr += bytes;
675fa9e4066Sahrens 		resid -= bytes;
676fa9e4066Sahrens 	}
677fa9e4066Sahrens 
678fa9e4066Sahrens 	close(fd);
679fa9e4066Sahrens 
680fa9e4066Sahrens 	return (0);
681fa9e4066Sahrens }
682fa9e4066Sahrens 
683fa9e4066Sahrens int
684fa9e4066Sahrens random_get_bytes(uint8_t *ptr, size_t len)
685fa9e4066Sahrens {
686fa9e4066Sahrens 	return (random_get_bytes_common(ptr, len, "/dev/random"));
687fa9e4066Sahrens }
688fa9e4066Sahrens 
689fa9e4066Sahrens int
690fa9e4066Sahrens random_get_pseudo_bytes(uint8_t *ptr, size_t len)
691fa9e4066Sahrens {
692fa9e4066Sahrens 	return (random_get_bytes_common(ptr, len, "/dev/urandom"));
693fa9e4066Sahrens }
694fa9e4066Sahrens 
695fa9e4066Sahrens /*
696fa9e4066Sahrens  * =========================================================================
697fa9e4066Sahrens  * kernel emulation setup & teardown
698fa9e4066Sahrens  * =========================================================================
699fa9e4066Sahrens  */
700fa9e4066Sahrens static int
701fa9e4066Sahrens umem_out_of_memory(void)
702fa9e4066Sahrens {
703fa9e4066Sahrens 	char errmsg[] = "out of memory -- generating core dump\n";
704fa9e4066Sahrens 
705fa9e4066Sahrens 	write(fileno(stderr), errmsg, sizeof (errmsg));
706fa9e4066Sahrens 	abort();
707fa9e4066Sahrens 	return (0);
708fa9e4066Sahrens }
709fa9e4066Sahrens 
710fa9e4066Sahrens void
711fa9e4066Sahrens kernel_init(int mode)
712fa9e4066Sahrens {
713fa9e4066Sahrens 	umem_nofail_callback(umem_out_of_memory);
714fa9e4066Sahrens 
715fa9e4066Sahrens 	physmem = sysconf(_SC_PHYS_PAGES);
716fa9e4066Sahrens 
717fa9e4066Sahrens 	dprintf("physmem = %llu pages (%.2f GB)\n", physmem,
718fa9e4066Sahrens 	    (double)physmem * sysconf(_SC_PAGE_SIZE) / (1ULL << 30));
719fa9e4066Sahrens 
720fa9e4066Sahrens 	spa_init(mode);
721fa9e4066Sahrens }
722fa9e4066Sahrens 
723fa9e4066Sahrens void
724fa9e4066Sahrens kernel_fini(void)
725fa9e4066Sahrens {
726fa9e4066Sahrens 	spa_fini();
727fa9e4066Sahrens }
728