xref: /illumos-gate/usr/src/uts/common/fs/zfs/zvol.c (revision ea8dc4b6d2251b437950c0056bc626b311c73c27)
1fa9e4066Sahrens /*
2fa9e4066Sahrens  * CDDL HEADER START
3fa9e4066Sahrens  *
4fa9e4066Sahrens  * The contents of this file are subject to the terms of the
5*ea8dc4b6Seschrock  * Common Development and Distribution License (the "License").
6*ea8dc4b6Seschrock  * You may not use this file except in compliance with the License.
7fa9e4066Sahrens  *
8fa9e4066Sahrens  * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE
9fa9e4066Sahrens  * or http://www.opensolaris.org/os/licensing.
10fa9e4066Sahrens  * See the License for the specific language governing permissions
11fa9e4066Sahrens  * and limitations under the License.
12fa9e4066Sahrens  *
13fa9e4066Sahrens  * When distributing Covered Code, include this CDDL HEADER in each
14fa9e4066Sahrens  * file and include the License file at usr/src/OPENSOLARIS.LICENSE.
15fa9e4066Sahrens  * If applicable, add the following below this CDDL HEADER, with the
16fa9e4066Sahrens  * fields enclosed by brackets "[]" replaced with your own identifying
17fa9e4066Sahrens  * information: Portions Copyright [yyyy] [name of copyright owner]
18fa9e4066Sahrens  *
19fa9e4066Sahrens  * CDDL HEADER END
20fa9e4066Sahrens  */
21fa9e4066Sahrens /*
227f7322feSeschrock  * Copyright 2006 Sun Microsystems, Inc.  All rights reserved.
23fa9e4066Sahrens  * Use is subject to license terms.
24fa9e4066Sahrens  */
25fa9e4066Sahrens 
26fa9e4066Sahrens #pragma ident	"%Z%%M%	%I%	%E% SMI"
27fa9e4066Sahrens 
28fa9e4066Sahrens /*
29fa9e4066Sahrens  * ZFS volume emulation driver.
30fa9e4066Sahrens  *
31fa9e4066Sahrens  * Makes a DMU object look like a volume of arbitrary size, up to 2^64 bytes.
32fa9e4066Sahrens  * Volumes are accessed through the symbolic links named:
33fa9e4066Sahrens  *
34fa9e4066Sahrens  * /dev/zvol/dsk/<pool_name>/<dataset_name>
35fa9e4066Sahrens  * /dev/zvol/rdsk/<pool_name>/<dataset_name>
36fa9e4066Sahrens  *
37fa9e4066Sahrens  * These links are created by the ZFS-specific devfsadm link generator.
38fa9e4066Sahrens  * Volumes are persistent through reboot.  No user command needs to be
39fa9e4066Sahrens  * run before opening and using a device.
40fa9e4066Sahrens  */
41fa9e4066Sahrens 
42fa9e4066Sahrens #include <sys/types.h>
43fa9e4066Sahrens #include <sys/param.h>
44fa9e4066Sahrens #include <sys/errno.h>
45fa9e4066Sahrens #include <sys/aio_req.h>
46fa9e4066Sahrens #include <sys/uio.h>
47fa9e4066Sahrens #include <sys/buf.h>
48fa9e4066Sahrens #include <sys/modctl.h>
49fa9e4066Sahrens #include <sys/open.h>
50fa9e4066Sahrens #include <sys/kmem.h>
51fa9e4066Sahrens #include <sys/conf.h>
52fa9e4066Sahrens #include <sys/cmn_err.h>
53fa9e4066Sahrens #include <sys/stat.h>
54fa9e4066Sahrens #include <sys/zap.h>
55fa9e4066Sahrens #include <sys/spa.h>
56fa9e4066Sahrens #include <sys/zio.h>
57fa9e4066Sahrens #include <sys/dsl_prop.h>
58fa9e4066Sahrens #include <sys/dkio.h>
59fa9e4066Sahrens #include <sys/efi_partition.h>
60fa9e4066Sahrens #include <sys/byteorder.h>
61fa9e4066Sahrens #include <sys/pathname.h>
62fa9e4066Sahrens #include <sys/ddi.h>
63fa9e4066Sahrens #include <sys/sunddi.h>
64fa9e4066Sahrens #include <sys/crc32.h>
65fa9e4066Sahrens #include <sys/dirent.h>
66fa9e4066Sahrens #include <sys/policy.h>
67fa9e4066Sahrens #include <sys/fs/zfs.h>
68fa9e4066Sahrens #include <sys/zfs_ioctl.h>
69fa9e4066Sahrens #include <sys/mkdev.h>
7022ac5be4Sperrin #include <sys/zil.h>
71fa9e4066Sahrens 
72fa9e4066Sahrens #include "zfs_namecheck.h"
73fa9e4066Sahrens 
74fa9e4066Sahrens #define	ZVOL_OBJ		1ULL
75fa9e4066Sahrens #define	ZVOL_ZAP_OBJ		2ULL
76fa9e4066Sahrens 
77fa9e4066Sahrens static void *zvol_state;
78fa9e4066Sahrens 
79fa9e4066Sahrens /*
80fa9e4066Sahrens  * This lock protects the zvol_state structure from being modified
81fa9e4066Sahrens  * while it's being used, e.g. an open that comes in before a create
82fa9e4066Sahrens  * finishes.  It also protects temporary opens of the dataset so that,
83fa9e4066Sahrens  * e.g., an open doesn't get a spurious EBUSY.
84fa9e4066Sahrens  */
85fa9e4066Sahrens static kmutex_t zvol_state_lock;
86fa9e4066Sahrens static uint32_t zvol_minors;
87fa9e4066Sahrens 
88fa9e4066Sahrens /*
89fa9e4066Sahrens  * The in-core state of each volume.
90fa9e4066Sahrens  */
91fa9e4066Sahrens typedef struct zvol_state {
92fa9e4066Sahrens 	char		zv_name[MAXPATHLEN]; /* pool/dd name */
93fa9e4066Sahrens 	uint64_t	zv_volsize;	/* amount of space we advertise */
94fa9e4066Sahrens 	minor_t		zv_minor;	/* minor number */
95fa9e4066Sahrens 	uint8_t		zv_min_bs;	/* minimum addressable block shift */
96fa9e4066Sahrens 	uint8_t		zv_readonly;	/* hard readonly; like write-protect */
97fa9e4066Sahrens 	objset_t	*zv_objset;	/* objset handle */
98fa9e4066Sahrens 	uint32_t	zv_mode;	/* DS_MODE_* flags at open time */
99fa9e4066Sahrens 	uint32_t	zv_open_count[OTYPCNT];	/* open counts */
100fa9e4066Sahrens 	uint32_t	zv_total_opens;	/* total open count */
10122ac5be4Sperrin 	zilog_t		*zv_zilog;	/* ZIL handle */
10222ac5be4Sperrin 	uint64_t	zv_txg_assign;	/* txg to assign during ZIL replay */
103fa9e4066Sahrens } zvol_state_t;
104fa9e4066Sahrens 
105fa9e4066Sahrens static void
106fa9e4066Sahrens zvol_size_changed(zvol_state_t *zv, dev_t dev)
107fa9e4066Sahrens {
108fa9e4066Sahrens 	dev = makedevice(getmajor(dev), zv->zv_minor);
109fa9e4066Sahrens 
110fa9e4066Sahrens 	VERIFY(ddi_prop_update_int64(dev, zfs_dip,
111fa9e4066Sahrens 	    "Size", zv->zv_volsize) == DDI_SUCCESS);
112fa9e4066Sahrens 	VERIFY(ddi_prop_update_int64(dev, zfs_dip,
113fa9e4066Sahrens 	    "Nblocks", lbtodb(zv->zv_volsize)) == DDI_SUCCESS);
114fa9e4066Sahrens }
115fa9e4066Sahrens 
116fa9e4066Sahrens int
1175c5460e9Seschrock zvol_check_volsize(zfs_cmd_t *zc, uint64_t blocksize)
118fa9e4066Sahrens {
119fa9e4066Sahrens 	if (zc->zc_volsize == 0)
120fa9e4066Sahrens 		return (EINVAL);
121fa9e4066Sahrens 
1225c5460e9Seschrock 	if (zc->zc_volsize % blocksize != 0)
1235c5460e9Seschrock 		return (EINVAL);
1245c5460e9Seschrock 
125fa9e4066Sahrens #ifdef _ILP32
126fa9e4066Sahrens 	if (zc->zc_volsize - 1 > SPEC_MAXOFFSET_T)
127fa9e4066Sahrens 		return (EOVERFLOW);
128fa9e4066Sahrens #endif
129fa9e4066Sahrens 	return (0);
130fa9e4066Sahrens }
131fa9e4066Sahrens 
132fa9e4066Sahrens int
133fa9e4066Sahrens zvol_check_volblocksize(zfs_cmd_t *zc)
134fa9e4066Sahrens {
135fa9e4066Sahrens 	if (zc->zc_volblocksize < SPA_MINBLOCKSIZE ||
136fa9e4066Sahrens 	    zc->zc_volblocksize > SPA_MAXBLOCKSIZE ||
137fa9e4066Sahrens 	    !ISP2(zc->zc_volblocksize))
138fa9e4066Sahrens 		return (EDOM);
139fa9e4066Sahrens 
140fa9e4066Sahrens 	return (0);
141fa9e4066Sahrens }
142fa9e4066Sahrens 
143fa9e4066Sahrens static void
144fa9e4066Sahrens zvol_readonly_changed_cb(void *arg, uint64_t newval)
145fa9e4066Sahrens {
146fa9e4066Sahrens 	zvol_state_t *zv = arg;
147fa9e4066Sahrens 
148fa9e4066Sahrens 	zv->zv_readonly = (uint8_t)newval;
149fa9e4066Sahrens }
150fa9e4066Sahrens 
151fa9e4066Sahrens int
152fa9e4066Sahrens zvol_get_stats(zfs_cmd_t *zc, objset_t *os)
153fa9e4066Sahrens {
154fa9e4066Sahrens 	int error;
155fa9e4066Sahrens 	dmu_object_info_t doi;
156fa9e4066Sahrens 
157fa9e4066Sahrens 	error = zap_lookup(os, ZVOL_ZAP_OBJ, "size", 8, 1, &zc->zc_volsize);
158fa9e4066Sahrens 
159fa9e4066Sahrens 	if (error)
160fa9e4066Sahrens 		return (error);
161fa9e4066Sahrens 
162fa9e4066Sahrens 	error = dmu_object_info(os, ZVOL_OBJ, &doi);
163fa9e4066Sahrens 
164fa9e4066Sahrens 	if (error == 0)
165fa9e4066Sahrens 		zc->zc_volblocksize = doi.doi_data_block_size;
166fa9e4066Sahrens 
167fa9e4066Sahrens 	return (error);
168fa9e4066Sahrens }
169fa9e4066Sahrens 
170fa9e4066Sahrens /*
171fa9e4066Sahrens  * Find a free minor number.
172fa9e4066Sahrens  */
173fa9e4066Sahrens static minor_t
174fa9e4066Sahrens zvol_minor_alloc(void)
175fa9e4066Sahrens {
176fa9e4066Sahrens 	minor_t minor;
177fa9e4066Sahrens 
178fa9e4066Sahrens 	ASSERT(MUTEX_HELD(&zvol_state_lock));
179fa9e4066Sahrens 
180fa9e4066Sahrens 	for (minor = 1; minor <= ZVOL_MAX_MINOR; minor++)
181fa9e4066Sahrens 		if (ddi_get_soft_state(zvol_state, minor) == NULL)
182fa9e4066Sahrens 			return (minor);
183fa9e4066Sahrens 
184fa9e4066Sahrens 	return (0);
185fa9e4066Sahrens }
186fa9e4066Sahrens 
187fa9e4066Sahrens static zvol_state_t *
188fa9e4066Sahrens zvol_minor_lookup(char *name)
189fa9e4066Sahrens {
190fa9e4066Sahrens 	minor_t minor;
191fa9e4066Sahrens 	zvol_state_t *zv;
192fa9e4066Sahrens 
193fa9e4066Sahrens 	ASSERT(MUTEX_HELD(&zvol_state_lock));
194fa9e4066Sahrens 
195fa9e4066Sahrens 	for (minor = 1; minor <= ZVOL_MAX_MINOR; minor++) {
196fa9e4066Sahrens 		zv = ddi_get_soft_state(zvol_state, minor);
197fa9e4066Sahrens 		if (zv == NULL)
198fa9e4066Sahrens 			continue;
199fa9e4066Sahrens 		if (strcmp(zv->zv_name, name) == 0)
200fa9e4066Sahrens 			break;
201fa9e4066Sahrens 	}
202fa9e4066Sahrens 
203fa9e4066Sahrens 	return (zv);
204fa9e4066Sahrens }
205fa9e4066Sahrens 
206fa9e4066Sahrens void
207fa9e4066Sahrens zvol_create_cb(objset_t *os, void *arg, dmu_tx_t *tx)
208fa9e4066Sahrens {
209fa9e4066Sahrens 	zfs_cmd_t *zc = arg;
210fa9e4066Sahrens 	int error;
211fa9e4066Sahrens 
212fa9e4066Sahrens 	error = dmu_object_claim(os, ZVOL_OBJ, DMU_OT_ZVOL, zc->zc_volblocksize,
213fa9e4066Sahrens 	    DMU_OT_NONE, 0, tx);
214fa9e4066Sahrens 	ASSERT(error == 0);
215fa9e4066Sahrens 
216fa9e4066Sahrens 	error = zap_create_claim(os, ZVOL_ZAP_OBJ, DMU_OT_ZVOL_PROP,
217fa9e4066Sahrens 	    DMU_OT_NONE, 0, tx);
218fa9e4066Sahrens 	ASSERT(error == 0);
219fa9e4066Sahrens 
220fa9e4066Sahrens 	error = zap_update(os, ZVOL_ZAP_OBJ, "size", 8, 1, &zc->zc_volsize, tx);
221fa9e4066Sahrens 	ASSERT(error == 0);
222fa9e4066Sahrens }
223fa9e4066Sahrens 
22422ac5be4Sperrin /*
22522ac5be4Sperrin  * Replay a TX_WRITE ZIL transaction that didn't get committed
22622ac5be4Sperrin  * after a system failure
22722ac5be4Sperrin  */
22822ac5be4Sperrin static int
22922ac5be4Sperrin zvol_replay_write(zvol_state_t *zv, lr_write_t *lr, boolean_t byteswap)
23022ac5be4Sperrin {
23122ac5be4Sperrin 	objset_t *os = zv->zv_objset;
23222ac5be4Sperrin 	char *data = (char *)(lr + 1);	/* data follows lr_write_t */
23322ac5be4Sperrin 	uint64_t off = lr->lr_offset;
23422ac5be4Sperrin 	uint64_t len = lr->lr_length;
23522ac5be4Sperrin 	dmu_tx_t *tx;
23622ac5be4Sperrin 	int error;
23722ac5be4Sperrin 
23822ac5be4Sperrin 	if (byteswap)
23922ac5be4Sperrin 		byteswap_uint64_array(lr, sizeof (*lr));
24022ac5be4Sperrin 
24122ac5be4Sperrin restart:
24222ac5be4Sperrin 	tx = dmu_tx_create(os);
24322ac5be4Sperrin 	dmu_tx_hold_write(tx, ZVOL_OBJ, off, len);
24422ac5be4Sperrin 	error = dmu_tx_assign(tx, zv->zv_txg_assign);
24522ac5be4Sperrin 	if (error) {
24622ac5be4Sperrin 		dmu_tx_abort(tx);
24722ac5be4Sperrin 		if (error == ERESTART && zv->zv_txg_assign == TXG_NOWAIT) {
24822ac5be4Sperrin 			txg_wait_open(dmu_objset_pool(os), 0);
24922ac5be4Sperrin 			goto restart;
25022ac5be4Sperrin 		}
25122ac5be4Sperrin 	} else {
25222ac5be4Sperrin 		dmu_write(os, ZVOL_OBJ, off, len, data, tx);
25322ac5be4Sperrin 		dmu_tx_commit(tx);
25422ac5be4Sperrin 	}
25522ac5be4Sperrin 
25622ac5be4Sperrin 	return (error);
25722ac5be4Sperrin }
25822ac5be4Sperrin 
25922ac5be4Sperrin /* ARGSUSED */
26022ac5be4Sperrin static int
26122ac5be4Sperrin zvol_replay_err(zvol_state_t *zv, lr_t *lr, boolean_t byteswap)
26222ac5be4Sperrin {
26322ac5be4Sperrin 	return (ENOTSUP);
26422ac5be4Sperrin }
26522ac5be4Sperrin 
26622ac5be4Sperrin /*
26722ac5be4Sperrin  * Callback vectors for replaying records.
26822ac5be4Sperrin  * Only TX_WRITE is needed for zvol.
26922ac5be4Sperrin  */
27022ac5be4Sperrin zil_replay_func_t *zvol_replay_vector[TX_MAX_TYPE] = {
27122ac5be4Sperrin 	zvol_replay_err,	/* 0 no such transaction type */
27222ac5be4Sperrin 	zvol_replay_err,	/* TX_CREATE */
27322ac5be4Sperrin 	zvol_replay_err,	/* TX_MKDIR */
27422ac5be4Sperrin 	zvol_replay_err,	/* TX_MKXATTR */
27522ac5be4Sperrin 	zvol_replay_err,	/* TX_SYMLINK */
27622ac5be4Sperrin 	zvol_replay_err,	/* TX_REMOVE */
27722ac5be4Sperrin 	zvol_replay_err,	/* TX_RMDIR */
27822ac5be4Sperrin 	zvol_replay_err,	/* TX_LINK */
27922ac5be4Sperrin 	zvol_replay_err,	/* TX_RENAME */
28022ac5be4Sperrin 	zvol_replay_write,	/* TX_WRITE */
28122ac5be4Sperrin 	zvol_replay_err,	/* TX_TRUNCATE */
28222ac5be4Sperrin 	zvol_replay_err,	/* TX_SETATTR */
28322ac5be4Sperrin 	zvol_replay_err,	/* TX_ACL */
28422ac5be4Sperrin };
28522ac5be4Sperrin 
286fa9e4066Sahrens /*
287fa9e4066Sahrens  * Create a minor node for the specified volume.
288fa9e4066Sahrens  */
289fa9e4066Sahrens int
290fa9e4066Sahrens zvol_create_minor(zfs_cmd_t *zc)
291fa9e4066Sahrens {
292fa9e4066Sahrens 	char *name = zc->zc_name;
293fa9e4066Sahrens 	dev_t dev = zc->zc_dev;
294fa9e4066Sahrens 	zvol_state_t *zv;
295fa9e4066Sahrens 	objset_t *os;
296fa9e4066Sahrens 	uint64_t volsize;
297fa9e4066Sahrens 	minor_t minor = 0;
298fa9e4066Sahrens 	struct pathname linkpath;
299fa9e4066Sahrens 	int ds_mode = DS_MODE_PRIMARY;
300fa9e4066Sahrens 	vnode_t *vp = NULL;
301fa9e4066Sahrens 	char *devpath;
302fa9e4066Sahrens 	size_t devpathlen = strlen(ZVOL_FULL_DEV_DIR) + 1 + strlen(name) + 1;
303fa9e4066Sahrens 	char chrbuf[30], blkbuf[30];
304fa9e4066Sahrens 	int error;
305fa9e4066Sahrens 
306fa9e4066Sahrens 	mutex_enter(&zvol_state_lock);
307fa9e4066Sahrens 
308fa9e4066Sahrens 	if ((zv = zvol_minor_lookup(name)) != NULL) {
309fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
310fa9e4066Sahrens 		return (EEXIST);
311fa9e4066Sahrens 	}
312fa9e4066Sahrens 
313fa9e4066Sahrens 	if (strchr(name, '@') != 0)
314fa9e4066Sahrens 		ds_mode |= DS_MODE_READONLY;
315fa9e4066Sahrens 
316fa9e4066Sahrens 	error = dmu_objset_open(name, DMU_OST_ZVOL, ds_mode, &os);
317fa9e4066Sahrens 
318fa9e4066Sahrens 	if (error) {
319fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
320fa9e4066Sahrens 		return (error);
321fa9e4066Sahrens 	}
322fa9e4066Sahrens 
323fa9e4066Sahrens 	error = zap_lookup(os, ZVOL_ZAP_OBJ, "size", 8, 1, &volsize);
324fa9e4066Sahrens 
325fa9e4066Sahrens 	if (error) {
326fa9e4066Sahrens 		dmu_objset_close(os);
327fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
328fa9e4066Sahrens 		return (error);
329fa9e4066Sahrens 	}
330fa9e4066Sahrens 
331fa9e4066Sahrens 	/*
332fa9e4066Sahrens 	 * If there's an existing /dev/zvol symlink, try to use the
333fa9e4066Sahrens 	 * same minor number we used last time.
334fa9e4066Sahrens 	 */
335fa9e4066Sahrens 	devpath = kmem_alloc(devpathlen, KM_SLEEP);
336fa9e4066Sahrens 
337fa9e4066Sahrens 	(void) sprintf(devpath, "%s/%s", ZVOL_FULL_DEV_DIR, name);
338fa9e4066Sahrens 
339fa9e4066Sahrens 	error = lookupname(devpath, UIO_SYSSPACE, NO_FOLLOW, NULL, &vp);
340fa9e4066Sahrens 
341fa9e4066Sahrens 	kmem_free(devpath, devpathlen);
342fa9e4066Sahrens 
343fa9e4066Sahrens 	if (error == 0 && vp->v_type != VLNK)
344fa9e4066Sahrens 		error = EINVAL;
345fa9e4066Sahrens 
346fa9e4066Sahrens 	if (error == 0) {
347fa9e4066Sahrens 		pn_alloc(&linkpath);
348fa9e4066Sahrens 		error = pn_getsymlink(vp, &linkpath, kcred);
349fa9e4066Sahrens 		if (error == 0) {
350fa9e4066Sahrens 			char *ms = strstr(linkpath.pn_path, ZVOL_PSEUDO_DEV);
351fa9e4066Sahrens 			if (ms != NULL) {
352fa9e4066Sahrens 				ms += strlen(ZVOL_PSEUDO_DEV);
353fa9e4066Sahrens 				minor = stoi(&ms);
354fa9e4066Sahrens 			}
355fa9e4066Sahrens 		}
356fa9e4066Sahrens 		pn_free(&linkpath);
357fa9e4066Sahrens 	}
358fa9e4066Sahrens 
359fa9e4066Sahrens 	if (vp != NULL)
360fa9e4066Sahrens 		VN_RELE(vp);
361fa9e4066Sahrens 
362fa9e4066Sahrens 	/*
363fa9e4066Sahrens 	 * If we found a minor but it's already in use, we must pick a new one.
364fa9e4066Sahrens 	 */
365fa9e4066Sahrens 	if (minor != 0 && ddi_get_soft_state(zvol_state, minor) != NULL)
366fa9e4066Sahrens 		minor = 0;
367fa9e4066Sahrens 
368fa9e4066Sahrens 	if (minor == 0)
369fa9e4066Sahrens 		minor = zvol_minor_alloc();
370fa9e4066Sahrens 
371fa9e4066Sahrens 	if (minor == 0) {
372fa9e4066Sahrens 		dmu_objset_close(os);
373fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
374fa9e4066Sahrens 		return (ENXIO);
375fa9e4066Sahrens 	}
376fa9e4066Sahrens 
377fa9e4066Sahrens 	if (ddi_soft_state_zalloc(zvol_state, minor) != DDI_SUCCESS) {
378fa9e4066Sahrens 		dmu_objset_close(os);
379fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
380fa9e4066Sahrens 		return (EAGAIN);
381fa9e4066Sahrens 	}
382fa9e4066Sahrens 
383fa9e4066Sahrens 	(void) ddi_prop_update_string(minor, zfs_dip, ZVOL_PROP_NAME, name);
384fa9e4066Sahrens 
385fa9e4066Sahrens 	(void) sprintf(chrbuf, "%uc,raw", minor);
386fa9e4066Sahrens 
387fa9e4066Sahrens 	if (ddi_create_minor_node(zfs_dip, chrbuf, S_IFCHR,
388fa9e4066Sahrens 	    minor, DDI_PSEUDO, 0) == DDI_FAILURE) {
389fa9e4066Sahrens 		ddi_soft_state_free(zvol_state, minor);
390fa9e4066Sahrens 		dmu_objset_close(os);
391fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
392fa9e4066Sahrens 		return (EAGAIN);
393fa9e4066Sahrens 	}
394fa9e4066Sahrens 
395fa9e4066Sahrens 	(void) sprintf(blkbuf, "%uc", minor);
396fa9e4066Sahrens 
397fa9e4066Sahrens 	if (ddi_create_minor_node(zfs_dip, blkbuf, S_IFBLK,
398fa9e4066Sahrens 	    minor, DDI_PSEUDO, 0) == DDI_FAILURE) {
399fa9e4066Sahrens 		ddi_remove_minor_node(zfs_dip, chrbuf);
400fa9e4066Sahrens 		ddi_soft_state_free(zvol_state, minor);
401fa9e4066Sahrens 		dmu_objset_close(os);
402fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
403fa9e4066Sahrens 		return (EAGAIN);
404fa9e4066Sahrens 	}
405fa9e4066Sahrens 
406fa9e4066Sahrens 	zv = ddi_get_soft_state(zvol_state, minor);
407fa9e4066Sahrens 
408fa9e4066Sahrens 	(void) strcpy(zv->zv_name, name);
409fa9e4066Sahrens 	zv->zv_min_bs = DEV_BSHIFT;
410fa9e4066Sahrens 	zv->zv_minor = minor;
411fa9e4066Sahrens 	zv->zv_volsize = volsize;
412fa9e4066Sahrens 	zv->zv_objset = os;
413fa9e4066Sahrens 	zv->zv_mode = ds_mode;
41422ac5be4Sperrin 	zv->zv_zilog = zil_open(os, NULL);
41522ac5be4Sperrin 
41622ac5be4Sperrin 	zil_replay(os, zv, &zv->zv_txg_assign, zvol_replay_vector, NULL);
417fa9e4066Sahrens 
418fa9e4066Sahrens 	zvol_size_changed(zv, dev);
419fa9e4066Sahrens 
420*ea8dc4b6Seschrock 	/* XXX this should handle the possible i/o error */
421fa9e4066Sahrens 	VERIFY(dsl_prop_register(dmu_objset_ds(zv->zv_objset),
422fa9e4066Sahrens 	    "readonly", zvol_readonly_changed_cb, zv) == 0);
423fa9e4066Sahrens 
424fa9e4066Sahrens 	zvol_minors++;
425fa9e4066Sahrens 
426fa9e4066Sahrens 	mutex_exit(&zvol_state_lock);
427fa9e4066Sahrens 
428fa9e4066Sahrens 	return (0);
429fa9e4066Sahrens }
430fa9e4066Sahrens 
431fa9e4066Sahrens /*
432fa9e4066Sahrens  * Remove minor node for the specified volume.
433fa9e4066Sahrens  */
434fa9e4066Sahrens int
435fa9e4066Sahrens zvol_remove_minor(zfs_cmd_t *zc)
436fa9e4066Sahrens {
437fa9e4066Sahrens 	zvol_state_t *zv;
438fa9e4066Sahrens 	char namebuf[30];
439fa9e4066Sahrens 
440fa9e4066Sahrens 	mutex_enter(&zvol_state_lock);
441fa9e4066Sahrens 
442fa9e4066Sahrens 	if ((zv = zvol_minor_lookup(zc->zc_name)) == NULL) {
443fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
444fa9e4066Sahrens 		return (ENXIO);
445fa9e4066Sahrens 	}
446fa9e4066Sahrens 
447fa9e4066Sahrens 	if (zv->zv_total_opens != 0) {
448fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
449fa9e4066Sahrens 		return (EBUSY);
450fa9e4066Sahrens 	}
451fa9e4066Sahrens 
452fa9e4066Sahrens 	(void) sprintf(namebuf, "%uc,raw", zv->zv_minor);
453fa9e4066Sahrens 	ddi_remove_minor_node(zfs_dip, namebuf);
454fa9e4066Sahrens 
455fa9e4066Sahrens 	(void) sprintf(namebuf, "%uc", zv->zv_minor);
456fa9e4066Sahrens 	ddi_remove_minor_node(zfs_dip, namebuf);
457fa9e4066Sahrens 
458fa9e4066Sahrens 	VERIFY(dsl_prop_unregister(dmu_objset_ds(zv->zv_objset),
459fa9e4066Sahrens 	    "readonly", zvol_readonly_changed_cb, zv) == 0);
460fa9e4066Sahrens 
46122ac5be4Sperrin 	zil_close(zv->zv_zilog);
46222ac5be4Sperrin 	zv->zv_zilog = NULL;
463fa9e4066Sahrens 	dmu_objset_close(zv->zv_objset);
464fa9e4066Sahrens 	zv->zv_objset = NULL;
465fa9e4066Sahrens 
466fa9e4066Sahrens 	ddi_soft_state_free(zvol_state, zv->zv_minor);
467fa9e4066Sahrens 
468fa9e4066Sahrens 	zvol_minors--;
469fa9e4066Sahrens 
470fa9e4066Sahrens 	mutex_exit(&zvol_state_lock);
471fa9e4066Sahrens 
472fa9e4066Sahrens 	return (0);
473fa9e4066Sahrens }
474fa9e4066Sahrens 
475fa9e4066Sahrens int
476fa9e4066Sahrens zvol_set_volsize(zfs_cmd_t *zc)
477fa9e4066Sahrens {
478fa9e4066Sahrens 	zvol_state_t *zv;
479fa9e4066Sahrens 	dev_t dev = zc->zc_dev;
480fa9e4066Sahrens 	dmu_tx_t *tx;
481fa9e4066Sahrens 	int error;
4825c5460e9Seschrock 	dmu_object_info_t doi;
483fa9e4066Sahrens 
484fa9e4066Sahrens 	mutex_enter(&zvol_state_lock);
485fa9e4066Sahrens 
486fa9e4066Sahrens 	if ((zv = zvol_minor_lookup(zc->zc_name)) == NULL) {
487fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
488fa9e4066Sahrens 		return (ENXIO);
489fa9e4066Sahrens 	}
490fa9e4066Sahrens 
4915c5460e9Seschrock 	if ((error = dmu_object_info(zv->zv_objset, ZVOL_OBJ, &doi)) != 0 ||
4925c5460e9Seschrock 	    (error = zvol_check_volsize(zc, doi.doi_data_block_size)) != 0) {
4935c5460e9Seschrock 		mutex_exit(&zvol_state_lock);
4945c5460e9Seschrock 		return (error);
4955c5460e9Seschrock 	}
4965c5460e9Seschrock 
497fa9e4066Sahrens 	if (zv->zv_readonly || (zv->zv_mode & DS_MODE_READONLY)) {
498fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
499fa9e4066Sahrens 		return (EROFS);
500fa9e4066Sahrens 	}
501fa9e4066Sahrens 
502fa9e4066Sahrens 	tx = dmu_tx_create(zv->zv_objset);
503*ea8dc4b6Seschrock 	dmu_tx_hold_zap(tx, ZVOL_ZAP_OBJ, TRUE, NULL);
504fa9e4066Sahrens 	dmu_tx_hold_free(tx, ZVOL_OBJ, zc->zc_volsize, DMU_OBJECT_END);
505fa9e4066Sahrens 	error = dmu_tx_assign(tx, TXG_WAIT);
506fa9e4066Sahrens 	if (error) {
507fa9e4066Sahrens 		dmu_tx_abort(tx);
508fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
509fa9e4066Sahrens 		return (error);
510fa9e4066Sahrens 	}
511fa9e4066Sahrens 
512fa9e4066Sahrens 	error = zap_update(zv->zv_objset, ZVOL_ZAP_OBJ, "size", 8, 1,
513fa9e4066Sahrens 	    &zc->zc_volsize, tx);
514*ea8dc4b6Seschrock 	if (error == 0) {
515*ea8dc4b6Seschrock 		error = dmu_free_range(zv->zv_objset, ZVOL_OBJ, zc->zc_volsize,
516fa9e4066Sahrens 		    DMU_OBJECT_END, tx);
517*ea8dc4b6Seschrock 	}
518fa9e4066Sahrens 
519fa9e4066Sahrens 	dmu_tx_commit(tx);
520fa9e4066Sahrens 
521fa9e4066Sahrens 	if (error == 0) {
522fa9e4066Sahrens 		zv->zv_volsize = zc->zc_volsize;
523fa9e4066Sahrens 		zvol_size_changed(zv, dev);
524fa9e4066Sahrens 	}
525fa9e4066Sahrens 
526fa9e4066Sahrens 	mutex_exit(&zvol_state_lock);
527fa9e4066Sahrens 
528fa9e4066Sahrens 	return (error);
529fa9e4066Sahrens }
530fa9e4066Sahrens 
531fa9e4066Sahrens int
532fa9e4066Sahrens zvol_set_volblocksize(zfs_cmd_t *zc)
533fa9e4066Sahrens {
534fa9e4066Sahrens 	zvol_state_t *zv;
535fa9e4066Sahrens 	dmu_tx_t *tx;
536fa9e4066Sahrens 	int error;
537fa9e4066Sahrens 
538fa9e4066Sahrens 	mutex_enter(&zvol_state_lock);
539fa9e4066Sahrens 
540fa9e4066Sahrens 	if ((zv = zvol_minor_lookup(zc->zc_name)) == NULL) {
541fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
542fa9e4066Sahrens 		return (ENXIO);
543fa9e4066Sahrens 	}
544fa9e4066Sahrens 
545fa9e4066Sahrens 	if (zv->zv_readonly || (zv->zv_mode & DS_MODE_READONLY)) {
546fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
547fa9e4066Sahrens 		return (EROFS);
548fa9e4066Sahrens 	}
549fa9e4066Sahrens 
550fa9e4066Sahrens 	tx = dmu_tx_create(zv->zv_objset);
551fa9e4066Sahrens 	dmu_tx_hold_bonus(tx, ZVOL_OBJ);
552fa9e4066Sahrens 	error = dmu_tx_assign(tx, TXG_WAIT);
553fa9e4066Sahrens 	if (error) {
554fa9e4066Sahrens 		dmu_tx_abort(tx);
555fa9e4066Sahrens 	} else {
556fa9e4066Sahrens 		error = dmu_object_set_blocksize(zv->zv_objset, ZVOL_OBJ,
557fa9e4066Sahrens 		    zc->zc_volblocksize, 0, tx);
558fa9e4066Sahrens 		if (error == ENOTSUP)
559fa9e4066Sahrens 			error = EBUSY;
560fa9e4066Sahrens 		dmu_tx_commit(tx);
561fa9e4066Sahrens 	}
562fa9e4066Sahrens 
563fa9e4066Sahrens 	mutex_exit(&zvol_state_lock);
564fa9e4066Sahrens 
565fa9e4066Sahrens 	return (error);
566fa9e4066Sahrens }
567fa9e4066Sahrens 
568fa9e4066Sahrens /*ARGSUSED*/
569fa9e4066Sahrens int
570fa9e4066Sahrens zvol_open(dev_t *devp, int flag, int otyp, cred_t *cr)
571fa9e4066Sahrens {
572fa9e4066Sahrens 	minor_t minor = getminor(*devp);
573fa9e4066Sahrens 	zvol_state_t *zv;
574fa9e4066Sahrens 
575fa9e4066Sahrens 	if (minor == 0)			/* This is the control device */
576fa9e4066Sahrens 		return (0);
577fa9e4066Sahrens 
578fa9e4066Sahrens 	mutex_enter(&zvol_state_lock);
579fa9e4066Sahrens 
580fa9e4066Sahrens 	zv = ddi_get_soft_state(zvol_state, minor);
581fa9e4066Sahrens 	if (zv == NULL) {
582fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
583fa9e4066Sahrens 		return (ENXIO);
584fa9e4066Sahrens 	}
585fa9e4066Sahrens 
586fa9e4066Sahrens 	ASSERT(zv->zv_objset != NULL);
587fa9e4066Sahrens 
588fa9e4066Sahrens 	if ((flag & FWRITE) &&
589fa9e4066Sahrens 	    (zv->zv_readonly || (zv->zv_mode & DS_MODE_READONLY))) {
590fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
591fa9e4066Sahrens 		return (EROFS);
592fa9e4066Sahrens 	}
593fa9e4066Sahrens 
594fa9e4066Sahrens 	if (zv->zv_open_count[otyp] == 0 || otyp == OTYP_LYR) {
595fa9e4066Sahrens 		zv->zv_open_count[otyp]++;
596fa9e4066Sahrens 		zv->zv_total_opens++;
597fa9e4066Sahrens 	}
598fa9e4066Sahrens 
599fa9e4066Sahrens 	mutex_exit(&zvol_state_lock);
600fa9e4066Sahrens 
601fa9e4066Sahrens 	return (0);
602fa9e4066Sahrens }
603fa9e4066Sahrens 
604fa9e4066Sahrens /*ARGSUSED*/
605fa9e4066Sahrens int
606fa9e4066Sahrens zvol_close(dev_t dev, int flag, int otyp, cred_t *cr)
607fa9e4066Sahrens {
608fa9e4066Sahrens 	minor_t minor = getminor(dev);
609fa9e4066Sahrens 	zvol_state_t *zv;
610fa9e4066Sahrens 
611fa9e4066Sahrens 	if (minor == 0)		/* This is the control device */
612fa9e4066Sahrens 		return (0);
613fa9e4066Sahrens 
614fa9e4066Sahrens 	mutex_enter(&zvol_state_lock);
615fa9e4066Sahrens 
616fa9e4066Sahrens 	zv = ddi_get_soft_state(zvol_state, minor);
617fa9e4066Sahrens 	if (zv == NULL) {
618fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
619fa9e4066Sahrens 		return (ENXIO);
620fa9e4066Sahrens 	}
621fa9e4066Sahrens 
622fa9e4066Sahrens 	/*
623fa9e4066Sahrens 	 * The next statement is a workaround for the following DDI bug:
624fa9e4066Sahrens 	 * 6343604 specfs race: multiple "last-close" of the same device
625fa9e4066Sahrens 	 */
626fa9e4066Sahrens 	if (zv->zv_total_opens == 0) {
627fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
628fa9e4066Sahrens 		return (0);
629fa9e4066Sahrens 	}
630fa9e4066Sahrens 
631fa9e4066Sahrens 	/*
632fa9e4066Sahrens 	 * If the open count is zero, this is a spurious close.
633fa9e4066Sahrens 	 * That indicates a bug in the kernel / DDI framework.
634fa9e4066Sahrens 	 */
635fa9e4066Sahrens 	ASSERT(zv->zv_open_count[otyp] != 0);
636fa9e4066Sahrens 	ASSERT(zv->zv_total_opens != 0);
637fa9e4066Sahrens 
638fa9e4066Sahrens 	/*
639fa9e4066Sahrens 	 * You may get multiple opens, but only one close.
640fa9e4066Sahrens 	 */
641fa9e4066Sahrens 	zv->zv_open_count[otyp]--;
642fa9e4066Sahrens 	zv->zv_total_opens--;
643fa9e4066Sahrens 
644fa9e4066Sahrens 	mutex_exit(&zvol_state_lock);
645fa9e4066Sahrens 
646fa9e4066Sahrens 	return (0);
647fa9e4066Sahrens }
648fa9e4066Sahrens 
64922ac5be4Sperrin /*
65022ac5be4Sperrin  * zvol_log_write() handles synchronous page writes using
65122ac5be4Sperrin  * TX_WRITE ZIL transactions.
65222ac5be4Sperrin  *
65322ac5be4Sperrin  * We store data in the log buffers if it's small enough.
65422ac5be4Sperrin  * Otherwise we flush the data out via dmu_sync().
65522ac5be4Sperrin  */
65622ac5be4Sperrin ssize_t zvol_immediate_write_sz = 65536;
65722ac5be4Sperrin 
65822ac5be4Sperrin int
65922ac5be4Sperrin zvol_log_write(zvol_state_t *zv, dmu_tx_t *tx, offset_t off, ssize_t len,
66022ac5be4Sperrin     char *addr)
66122ac5be4Sperrin {
66222ac5be4Sperrin 	itx_t *itx;
66322ac5be4Sperrin 	lr_write_t *lr;
66422ac5be4Sperrin 	objset_t *os = zv->zv_objset;
66522ac5be4Sperrin 	int dlen;
66622ac5be4Sperrin 	int error;
66722ac5be4Sperrin 
66822ac5be4Sperrin 	dlen = (len <= zvol_immediate_write_sz ? len : 0);
66922ac5be4Sperrin 	itx = zil_itx_create(TX_WRITE, sizeof (*lr) + dlen);
67022ac5be4Sperrin 	lr = (lr_write_t *)&itx->itx_lr;
67122ac5be4Sperrin 	lr->lr_foid = ZVOL_OBJ;
67222ac5be4Sperrin 	lr->lr_offset = off;
67322ac5be4Sperrin 	lr->lr_length = len;
67422ac5be4Sperrin 	lr->lr_blkoff = 0;
67522ac5be4Sperrin 	BP_ZERO(&lr->lr_blkptr);
67622ac5be4Sperrin 
67722ac5be4Sperrin 	/*
67822ac5be4Sperrin 	 * Get the data as we know we'll be writing it immediately
67922ac5be4Sperrin 	 */
68022ac5be4Sperrin 	if (dlen) { /* immediate write */
68122ac5be4Sperrin 		bcopy(addr, (char *)itx + offsetof(itx_t, itx_lr) +
68222ac5be4Sperrin 		    sizeof (*lr), len);
68322ac5be4Sperrin 	} else {
68422ac5be4Sperrin 		txg_suspend(dmu_objset_pool(os));
68522ac5be4Sperrin 		error = dmu_sync(os, ZVOL_OBJ, off, &lr->lr_blkoff,
68622ac5be4Sperrin 		    &lr->lr_blkptr, dmu_tx_get_txg(tx));
68722ac5be4Sperrin 		txg_resume(dmu_objset_pool(os));
68822ac5be4Sperrin 		if (error) {
68922ac5be4Sperrin 			kmem_free(itx, offsetof(itx_t, itx_lr));
69022ac5be4Sperrin 			return (error);
69122ac5be4Sperrin 		}
69222ac5be4Sperrin 	}
69322ac5be4Sperrin 	itx->itx_data_copied = 1;
69422ac5be4Sperrin 
69522ac5be4Sperrin 	(void) zil_itx_assign(zv->zv_zilog, itx, tx);
69622ac5be4Sperrin 
69722ac5be4Sperrin 	return (0);
69822ac5be4Sperrin }
69922ac5be4Sperrin 
700fa9e4066Sahrens int
701fa9e4066Sahrens zvol_strategy(buf_t *bp)
702fa9e4066Sahrens {
703fa9e4066Sahrens 	zvol_state_t *zv = ddi_get_soft_state(zvol_state, getminor(bp->b_edev));
704fa9e4066Sahrens 	uint64_t off, volsize;
705fa9e4066Sahrens 	size_t size, resid;
706fa9e4066Sahrens 	char *addr;
70722ac5be4Sperrin 	objset_t *os;
708fa9e4066Sahrens 	int error = 0;
70922ac5be4Sperrin 	int sync;
710fa9e4066Sahrens 
711fa9e4066Sahrens 	if (zv == NULL) {
712fa9e4066Sahrens 		bioerror(bp, ENXIO);
713fa9e4066Sahrens 		biodone(bp);
714fa9e4066Sahrens 		return (0);
715fa9e4066Sahrens 	}
716fa9e4066Sahrens 
717fa9e4066Sahrens 	if (getminor(bp->b_edev) == 0) {
718fa9e4066Sahrens 		bioerror(bp, EINVAL);
719fa9e4066Sahrens 		biodone(bp);
720fa9e4066Sahrens 		return (0);
721fa9e4066Sahrens 	}
722fa9e4066Sahrens 
723fa9e4066Sahrens 	if (zv->zv_readonly && !(bp->b_flags & B_READ)) {
724fa9e4066Sahrens 		bioerror(bp, EROFS);
725fa9e4066Sahrens 		biodone(bp);
726fa9e4066Sahrens 		return (0);
727fa9e4066Sahrens 	}
728fa9e4066Sahrens 
729fa9e4066Sahrens 	off = ldbtob(bp->b_blkno);
730fa9e4066Sahrens 	volsize = zv->zv_volsize;
731fa9e4066Sahrens 
73222ac5be4Sperrin 	os = zv->zv_objset;
73322ac5be4Sperrin 	ASSERT(os != NULL);
73422ac5be4Sperrin 	sync = !(bp->b_flags & B_ASYNC) && !(zil_disable);
735fa9e4066Sahrens 
736fa9e4066Sahrens 	bp_mapin(bp);
737fa9e4066Sahrens 	addr = bp->b_un.b_addr;
738fa9e4066Sahrens 	resid = bp->b_bcount;
739fa9e4066Sahrens 
740fa9e4066Sahrens 	while (resid != 0 && off < volsize) {
741fa9e4066Sahrens 
742fa9e4066Sahrens 		size = MIN(resid, 1UL << 20);	/* cap at 1MB per tx */
743fa9e4066Sahrens 
744fa9e4066Sahrens 		if (size > volsize - off)	/* don't write past the end */
745fa9e4066Sahrens 			size = volsize - off;
746fa9e4066Sahrens 
747fa9e4066Sahrens 		if (bp->b_flags & B_READ) {
748*ea8dc4b6Seschrock 			error = dmu_read(os, ZVOL_OBJ,
749fa9e4066Sahrens 			    off, size, addr);
750fa9e4066Sahrens 		} else {
75122ac5be4Sperrin 			dmu_tx_t *tx = dmu_tx_create(os);
752fa9e4066Sahrens 			dmu_tx_hold_write(tx, ZVOL_OBJ, off, size);
753fa9e4066Sahrens 			error = dmu_tx_assign(tx, TXG_WAIT);
754fa9e4066Sahrens 			if (error) {
755fa9e4066Sahrens 				dmu_tx_abort(tx);
756fa9e4066Sahrens 			} else {
75722ac5be4Sperrin 				dmu_write(os, ZVOL_OBJ, off, size, addr, tx);
75822ac5be4Sperrin 				if (sync) {
75922ac5be4Sperrin 					/* use the ZIL to commit this write */
76022ac5be4Sperrin 					error = zvol_log_write(zv, tx, off,
76122ac5be4Sperrin 					    size, addr);
76222ac5be4Sperrin 					if (error) {
76322ac5be4Sperrin 						txg_wait_synced(
76422ac5be4Sperrin 						    dmu_objset_pool(os), 0);
76522ac5be4Sperrin 						sync = B_FALSE;
76622ac5be4Sperrin 					}
76722ac5be4Sperrin 				}
768fa9e4066Sahrens 				dmu_tx_commit(tx);
769fa9e4066Sahrens 			}
770fa9e4066Sahrens 		}
771fa9e4066Sahrens 		if (error)
772fa9e4066Sahrens 			break;
773fa9e4066Sahrens 		off += size;
774fa9e4066Sahrens 		addr += size;
775fa9e4066Sahrens 		resid -= size;
776fa9e4066Sahrens 	}
777fa9e4066Sahrens 
778fa9e4066Sahrens 	if ((bp->b_resid = resid) == bp->b_bcount)
779fa9e4066Sahrens 		bioerror(bp, off > volsize ? EINVAL : error);
780fa9e4066Sahrens 
781fa9e4066Sahrens 	biodone(bp);
78222ac5be4Sperrin 
78322ac5be4Sperrin 	if (sync)
78422ac5be4Sperrin 		zil_commit(zv->zv_zilog, UINT64_MAX, FDSYNC);
78522ac5be4Sperrin 
786fa9e4066Sahrens 	return (0);
787fa9e4066Sahrens }
788fa9e4066Sahrens 
789fa9e4066Sahrens /*ARGSUSED*/
790fa9e4066Sahrens int
791fa9e4066Sahrens zvol_read(dev_t dev, uio_t *uiop, cred_t *cr)
792fa9e4066Sahrens {
793fa9e4066Sahrens 	return (physio(zvol_strategy, NULL, dev, B_READ, minphys, uiop));
794fa9e4066Sahrens }
795fa9e4066Sahrens 
796fa9e4066Sahrens /*ARGSUSED*/
797fa9e4066Sahrens int
798fa9e4066Sahrens zvol_write(dev_t dev, uio_t *uiop, cred_t *cr)
799fa9e4066Sahrens {
800fa9e4066Sahrens 	return (physio(zvol_strategy, NULL, dev, B_WRITE, minphys, uiop));
801fa9e4066Sahrens }
802fa9e4066Sahrens 
803fa9e4066Sahrens /*ARGSUSED*/
804fa9e4066Sahrens int
805fa9e4066Sahrens zvol_aread(dev_t dev, struct aio_req *aio, cred_t *cr)
806fa9e4066Sahrens {
807fa9e4066Sahrens 	return (aphysio(zvol_strategy, anocancel, dev, B_READ, minphys, aio));
808fa9e4066Sahrens }
809fa9e4066Sahrens 
810fa9e4066Sahrens /*ARGSUSED*/
811fa9e4066Sahrens int
812fa9e4066Sahrens zvol_awrite(dev_t dev, struct aio_req *aio, cred_t *cr)
813fa9e4066Sahrens {
814fa9e4066Sahrens 	return (aphysio(zvol_strategy, anocancel, dev, B_WRITE, minphys, aio));
815fa9e4066Sahrens }
816fa9e4066Sahrens 
817fa9e4066Sahrens /*
818fa9e4066Sahrens  * Dirtbag ioctls to support mkfs(1M) for UFS filesystems.  See dkio(7I).
819fa9e4066Sahrens  */
820fa9e4066Sahrens /*ARGSUSED*/
821fa9e4066Sahrens int
822fa9e4066Sahrens zvol_ioctl(dev_t dev, int cmd, intptr_t arg, int flag, cred_t *cr, int *rvalp)
823fa9e4066Sahrens {
824fa9e4066Sahrens 	zvol_state_t *zv;
825fa9e4066Sahrens 	struct dk_cinfo dkc;
826fa9e4066Sahrens 	struct dk_minfo dkm;
827fa9e4066Sahrens 	dk_efi_t efi;
828fa9e4066Sahrens 	efi_gpt_t gpt;
829fa9e4066Sahrens 	efi_gpe_t gpe;
830fa9e4066Sahrens 	struct uuid uuid = EFI_RESERVED;
831fa9e4066Sahrens 	uint32_t crc;
832fa9e4066Sahrens 	int error = 0;
833fa9e4066Sahrens 
834fa9e4066Sahrens 	mutex_enter(&zvol_state_lock);
835fa9e4066Sahrens 
836fa9e4066Sahrens 	zv = ddi_get_soft_state(zvol_state, getminor(dev));
837fa9e4066Sahrens 
838fa9e4066Sahrens 	if (zv == NULL) {
839fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
840fa9e4066Sahrens 		return (ENXIO);
841fa9e4066Sahrens 	}
842fa9e4066Sahrens 
843fa9e4066Sahrens 	switch (cmd) {
844fa9e4066Sahrens 
845fa9e4066Sahrens 	case DKIOCINFO:
846fa9e4066Sahrens 		bzero(&dkc, sizeof (dkc));
847fa9e4066Sahrens 		(void) strcpy(dkc.dki_cname, "zvol");
848fa9e4066Sahrens 		(void) strcpy(dkc.dki_dname, "zvol");
849fa9e4066Sahrens 		dkc.dki_ctype = DKC_UNKNOWN;
8508f8be083Sbonwick 		dkc.dki_maxtransfer = 1 << (SPA_MAXBLOCKSHIFT - zv->zv_min_bs);
851fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
852fa9e4066Sahrens 		if (ddi_copyout(&dkc, (void *)arg, sizeof (dkc), flag))
853fa9e4066Sahrens 			error = EFAULT;
854fa9e4066Sahrens 		return (error);
855fa9e4066Sahrens 
856fa9e4066Sahrens 	case DKIOCGMEDIAINFO:
857fa9e4066Sahrens 		bzero(&dkm, sizeof (dkm));
858fa9e4066Sahrens 		dkm.dki_lbsize = 1U << zv->zv_min_bs;
859fa9e4066Sahrens 		dkm.dki_capacity = zv->zv_volsize >> zv->zv_min_bs;
860fa9e4066Sahrens 		dkm.dki_media_type = DK_UNKNOWN;
861fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
862fa9e4066Sahrens 		if (ddi_copyout(&dkm, (void *)arg, sizeof (dkm), flag))
863fa9e4066Sahrens 			error = EFAULT;
864fa9e4066Sahrens 		return (error);
865fa9e4066Sahrens 
866fa9e4066Sahrens 	case DKIOCGETEFI:
867fa9e4066Sahrens 		if (ddi_copyin((void *)arg, &efi, sizeof (dk_efi_t), flag)) {
868fa9e4066Sahrens 			mutex_exit(&zvol_state_lock);
869fa9e4066Sahrens 			return (EFAULT);
870fa9e4066Sahrens 		}
871fa9e4066Sahrens 
872fa9e4066Sahrens 		bzero(&gpt, sizeof (gpt));
873fa9e4066Sahrens 		bzero(&gpe, sizeof (gpe));
874fa9e4066Sahrens 
875fa9e4066Sahrens 		efi.dki_data = (void *)(uintptr_t)efi.dki_data_64;
876fa9e4066Sahrens 
877fa9e4066Sahrens 		if (efi.dki_length < sizeof (gpt) + sizeof (gpe)) {
878fa9e4066Sahrens 			mutex_exit(&zvol_state_lock);
879fa9e4066Sahrens 			return (EINVAL);
880fa9e4066Sahrens 		}
881fa9e4066Sahrens 
882fa9e4066Sahrens 		efi.dki_length = sizeof (gpt) + sizeof (gpe);
883fa9e4066Sahrens 
884fa9e4066Sahrens 		gpt.efi_gpt_Signature = LE_64(EFI_SIGNATURE);
8855c5460e9Seschrock 		gpt.efi_gpt_Revision = LE_32(EFI_VERSION_CURRENT);
886fa9e4066Sahrens 		gpt.efi_gpt_HeaderSize = LE_32(sizeof (gpt));
887fa9e4066Sahrens 		gpt.efi_gpt_FirstUsableLBA = LE_64(0ULL);
888fa9e4066Sahrens 		gpt.efi_gpt_LastUsableLBA =
889fa9e4066Sahrens 		    LE_64((zv->zv_volsize >> zv->zv_min_bs) - 1);
890fa9e4066Sahrens 		gpt.efi_gpt_NumberOfPartitionEntries = LE_32(1);
891fa9e4066Sahrens 		gpt.efi_gpt_SizeOfPartitionEntry = LE_32(sizeof (gpe));
892fa9e4066Sahrens 
893fa9e4066Sahrens 		UUID_LE_CONVERT(gpe.efi_gpe_PartitionTypeGUID, uuid);
894fa9e4066Sahrens 		gpe.efi_gpe_StartingLBA = gpt.efi_gpt_FirstUsableLBA;
895fa9e4066Sahrens 		gpe.efi_gpe_EndingLBA = gpt.efi_gpt_LastUsableLBA;
896fa9e4066Sahrens 
897fa9e4066Sahrens 		CRC32(crc, &gpe, sizeof (gpe), -1U, crc32_table);
898fa9e4066Sahrens 		gpt.efi_gpt_PartitionEntryArrayCRC32 = LE_32(~crc);
899fa9e4066Sahrens 
900fa9e4066Sahrens 		CRC32(crc, &gpt, sizeof (gpt), -1U, crc32_table);
901fa9e4066Sahrens 		gpt.efi_gpt_HeaderCRC32 = LE_32(~crc);
902fa9e4066Sahrens 
903fa9e4066Sahrens 		mutex_exit(&zvol_state_lock);
904fa9e4066Sahrens 		if (ddi_copyout(&gpt, efi.dki_data, sizeof (gpt), flag) ||
905fa9e4066Sahrens 		    ddi_copyout(&gpe, efi.dki_data + 1, sizeof (gpe), flag))
906fa9e4066Sahrens 			error = EFAULT;
907fa9e4066Sahrens 		return (error);
908fa9e4066Sahrens 
909fa9e4066Sahrens 	default:
910fa9e4066Sahrens 		error = ENOTSUP;
911fa9e4066Sahrens 		break;
912fa9e4066Sahrens 
913fa9e4066Sahrens 	}
914fa9e4066Sahrens 	mutex_exit(&zvol_state_lock);
915fa9e4066Sahrens 	return (error);
916fa9e4066Sahrens }
917fa9e4066Sahrens 
918fa9e4066Sahrens int
919fa9e4066Sahrens zvol_busy(void)
920fa9e4066Sahrens {
921fa9e4066Sahrens 	return (zvol_minors != 0);
922fa9e4066Sahrens }
923fa9e4066Sahrens 
924fa9e4066Sahrens void
925fa9e4066Sahrens zvol_init(void)
926fa9e4066Sahrens {
927fa9e4066Sahrens 	VERIFY(ddi_soft_state_init(&zvol_state, sizeof (zvol_state_t), 1) == 0);
928fa9e4066Sahrens 	mutex_init(&zvol_state_lock, NULL, MUTEX_DEFAULT, NULL);
929fa9e4066Sahrens }
930fa9e4066Sahrens 
931fa9e4066Sahrens void
932fa9e4066Sahrens zvol_fini(void)
933fa9e4066Sahrens {
934fa9e4066Sahrens 	mutex_destroy(&zvol_state_lock);
935fa9e4066Sahrens 	ddi_soft_state_fini(&zvol_state);
936fa9e4066Sahrens }
937