7455fe24bbbebb14f0018467de771f9af4a2bda1
[cascardo/linux.git] / drivers / block / virtio_blk.c
1 //#define DEBUG
2 #include <linux/spinlock.h>
3 #include <linux/slab.h>
4 #include <linux/blkdev.h>
5 #include <linux/hdreg.h>
6 #include <linux/module.h>
7 #include <linux/mutex.h>
8 #include <linux/virtio.h>
9 #include <linux/virtio_blk.h>
10 #include <linux/scatterlist.h>
11 #include <linux/string_helpers.h>
12 #include <scsi/scsi_cmnd.h>
13 #include <linux/idr.h>
14 #include <linux/blk-mq.h>
15 #include <linux/numa.h>
16
17 #define PART_BITS 4
18
19 static int major;
20 static DEFINE_IDA(vd_index_ida);
21
22 static struct workqueue_struct *virtblk_wq;
23
24 struct virtio_blk
25 {
26         struct virtio_device *vdev;
27         struct virtqueue *vq;
28         spinlock_t vq_lock;
29
30         /* The disk structure for the kernel. */
31         struct gendisk *disk;
32
33         /* Process context for config space updates */
34         struct work_struct config_work;
35
36         /* Lock for config space updates */
37         struct mutex config_lock;
38
39         /* enable config space updates */
40         bool config_enable;
41
42         /* What host tells us, plus 2 for header & tailer. */
43         unsigned int sg_elems;
44
45         /* Ida index - used to track minor number allocations. */
46         int index;
47 };
48
49 struct virtblk_req
50 {
51         struct request *req;
52         struct virtio_blk_outhdr out_hdr;
53         struct virtio_scsi_inhdr in_hdr;
54         u8 status;
55         struct scatterlist sg[];
56 };
57
58 static inline int virtblk_result(struct virtblk_req *vbr)
59 {
60         switch (vbr->status) {
61         case VIRTIO_BLK_S_OK:
62                 return 0;
63         case VIRTIO_BLK_S_UNSUPP:
64                 return -ENOTTY;
65         default:
66                 return -EIO;
67         }
68 }
69
70 static int __virtblk_add_req(struct virtqueue *vq,
71                              struct virtblk_req *vbr,
72                              struct scatterlist *data_sg,
73                              bool have_data)
74 {
75         struct scatterlist hdr, status, cmd, sense, inhdr, *sgs[6];
76         unsigned int num_out = 0, num_in = 0;
77         int type = vbr->out_hdr.type & ~VIRTIO_BLK_T_OUT;
78
79         sg_init_one(&hdr, &vbr->out_hdr, sizeof(vbr->out_hdr));
80         sgs[num_out++] = &hdr;
81
82         /*
83          * If this is a packet command we need a couple of additional headers.
84          * Behind the normal outhdr we put a segment with the scsi command
85          * block, and before the normal inhdr we put the sense data and the
86          * inhdr with additional status information.
87          */
88         if (type == VIRTIO_BLK_T_SCSI_CMD) {
89                 sg_init_one(&cmd, vbr->req->cmd, vbr->req->cmd_len);
90                 sgs[num_out++] = &cmd;
91         }
92
93         if (have_data) {
94                 if (vbr->out_hdr.type & VIRTIO_BLK_T_OUT)
95                         sgs[num_out++] = data_sg;
96                 else
97                         sgs[num_out + num_in++] = data_sg;
98         }
99
100         if (type == VIRTIO_BLK_T_SCSI_CMD) {
101                 sg_init_one(&sense, vbr->req->sense, SCSI_SENSE_BUFFERSIZE);
102                 sgs[num_out + num_in++] = &sense;
103                 sg_init_one(&inhdr, &vbr->in_hdr, sizeof(vbr->in_hdr));
104                 sgs[num_out + num_in++] = &inhdr;
105         }
106
107         sg_init_one(&status, &vbr->status, sizeof(vbr->status));
108         sgs[num_out + num_in++] = &status;
109
110         return virtqueue_add_sgs(vq, sgs, num_out, num_in, vbr, GFP_ATOMIC);
111 }
112
113 static inline void virtblk_request_done(struct virtblk_req *vbr)
114 {
115         struct request *req = vbr->req;
116         int error = virtblk_result(vbr);
117
118         if (req->cmd_type == REQ_TYPE_BLOCK_PC) {
119                 req->resid_len = vbr->in_hdr.residual;
120                 req->sense_len = vbr->in_hdr.sense_len;
121                 req->errors = vbr->in_hdr.errors;
122         } else if (req->cmd_type == REQ_TYPE_SPECIAL) {
123                 req->errors = (error != 0);
124         }
125
126         blk_mq_end_io(req, error);
127 }
128
129 static void virtblk_done(struct virtqueue *vq)
130 {
131         struct virtio_blk *vblk = vq->vdev->priv;
132         bool req_done = false;
133         struct virtblk_req *vbr;
134         unsigned long flags;
135         unsigned int len;
136
137         spin_lock_irqsave(&vblk->vq_lock, flags);
138         do {
139                 virtqueue_disable_cb(vq);
140                 while ((vbr = virtqueue_get_buf(vblk->vq, &len)) != NULL) {
141                         virtblk_request_done(vbr);
142                         req_done = true;
143                 }
144         } while (!virtqueue_enable_cb(vq));
145         spin_unlock_irqrestore(&vblk->vq_lock, flags);
146
147         /* In case queue is stopped waiting for more buffers. */
148         if (req_done)
149                 blk_mq_start_stopped_hw_queues(vblk->disk->queue);
150 }
151
152 static int virtio_queue_rq(struct blk_mq_hw_ctx *hctx, struct request *req)
153 {
154         struct virtio_blk *vblk = hctx->queue->queuedata;
155         struct virtblk_req *vbr = req->special;
156         unsigned long flags;
157         unsigned int num;
158         const bool last = (req->cmd_flags & REQ_END) != 0;
159
160         BUG_ON(req->nr_phys_segments + 2 > vblk->sg_elems);
161
162         vbr->req = req;
163         if (req->cmd_flags & REQ_FLUSH) {
164                 vbr->out_hdr.type = VIRTIO_BLK_T_FLUSH;
165                 vbr->out_hdr.sector = 0;
166                 vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
167         } else {
168                 switch (req->cmd_type) {
169                 case REQ_TYPE_FS:
170                         vbr->out_hdr.type = 0;
171                         vbr->out_hdr.sector = blk_rq_pos(vbr->req);
172                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
173                         break;
174                 case REQ_TYPE_BLOCK_PC:
175                         vbr->out_hdr.type = VIRTIO_BLK_T_SCSI_CMD;
176                         vbr->out_hdr.sector = 0;
177                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
178                         break;
179                 case REQ_TYPE_SPECIAL:
180                         vbr->out_hdr.type = VIRTIO_BLK_T_GET_ID;
181                         vbr->out_hdr.sector = 0;
182                         vbr->out_hdr.ioprio = req_get_ioprio(vbr->req);
183                         break;
184                 default:
185                         /* We don't put anything else in the queue. */
186                         BUG();
187                 }
188         }
189
190         num = blk_rq_map_sg(hctx->queue, vbr->req, vbr->sg);
191         if (num) {
192                 if (rq_data_dir(vbr->req) == WRITE)
193                         vbr->out_hdr.type |= VIRTIO_BLK_T_OUT;
194                 else
195                         vbr->out_hdr.type |= VIRTIO_BLK_T_IN;
196         }
197
198         spin_lock_irqsave(&vblk->vq_lock, flags);
199         if (__virtblk_add_req(vblk->vq, vbr, vbr->sg, num) < 0) {
200                 spin_unlock_irqrestore(&vblk->vq_lock, flags);
201                 blk_mq_stop_hw_queue(hctx);
202                 virtqueue_kick(vblk->vq);
203                 return BLK_MQ_RQ_QUEUE_BUSY;
204         }
205         spin_unlock_irqrestore(&vblk->vq_lock, flags);
206
207         if (last)
208                 virtqueue_kick(vblk->vq);
209         return BLK_MQ_RQ_QUEUE_OK;
210 }
211
212 /* return id (s/n) string for *disk to *id_str
213  */
214 static int virtblk_get_id(struct gendisk *disk, char *id_str)
215 {
216         struct virtio_blk *vblk = disk->private_data;
217         struct request *req;
218         struct bio *bio;
219         int err;
220
221         bio = bio_map_kern(vblk->disk->queue, id_str, VIRTIO_BLK_ID_BYTES,
222                            GFP_KERNEL);
223         if (IS_ERR(bio))
224                 return PTR_ERR(bio);
225
226         req = blk_make_request(vblk->disk->queue, bio, GFP_KERNEL);
227         if (IS_ERR(req)) {
228                 bio_put(bio);
229                 return PTR_ERR(req);
230         }
231
232         req->cmd_type = REQ_TYPE_SPECIAL;
233         err = blk_execute_rq(vblk->disk->queue, vblk->disk, req, false);
234         blk_put_request(req);
235
236         return err;
237 }
238
239 static int virtblk_ioctl(struct block_device *bdev, fmode_t mode,
240                              unsigned int cmd, unsigned long data)
241 {
242         struct gendisk *disk = bdev->bd_disk;
243         struct virtio_blk *vblk = disk->private_data;
244
245         /*
246          * Only allow the generic SCSI ioctls if the host can support it.
247          */
248         if (!virtio_has_feature(vblk->vdev, VIRTIO_BLK_F_SCSI))
249                 return -ENOTTY;
250
251         return scsi_cmd_blk_ioctl(bdev, mode, cmd,
252                                   (void __user *)data);
253 }
254
255 /* We provide getgeo only to please some old bootloader/partitioning tools */
256 static int virtblk_getgeo(struct block_device *bd, struct hd_geometry *geo)
257 {
258         struct virtio_blk *vblk = bd->bd_disk->private_data;
259         struct virtio_blk_geometry vgeo;
260         int err;
261
262         /* see if the host passed in geometry config */
263         err = virtio_config_val(vblk->vdev, VIRTIO_BLK_F_GEOMETRY,
264                                 offsetof(struct virtio_blk_config, geometry),
265                                 &vgeo);
266
267         if (!err) {
268                 geo->heads = vgeo.heads;
269                 geo->sectors = vgeo.sectors;
270                 geo->cylinders = vgeo.cylinders;
271         } else {
272                 /* some standard values, similar to sd */
273                 geo->heads = 1 << 6;
274                 geo->sectors = 1 << 5;
275                 geo->cylinders = get_capacity(bd->bd_disk) >> 11;
276         }
277         return 0;
278 }
279
280 static const struct block_device_operations virtblk_fops = {
281         .ioctl  = virtblk_ioctl,
282         .owner  = THIS_MODULE,
283         .getgeo = virtblk_getgeo,
284 };
285
286 static int index_to_minor(int index)
287 {
288         return index << PART_BITS;
289 }
290
291 static int minor_to_index(int minor)
292 {
293         return minor >> PART_BITS;
294 }
295
296 static ssize_t virtblk_serial_show(struct device *dev,
297                                 struct device_attribute *attr, char *buf)
298 {
299         struct gendisk *disk = dev_to_disk(dev);
300         int err;
301
302         /* sysfs gives us a PAGE_SIZE buffer */
303         BUILD_BUG_ON(PAGE_SIZE < VIRTIO_BLK_ID_BYTES);
304
305         buf[VIRTIO_BLK_ID_BYTES] = '\0';
306         err = virtblk_get_id(disk, buf);
307         if (!err)
308                 return strlen(buf);
309
310         if (err == -EIO) /* Unsupported? Make it empty. */
311                 return 0;
312
313         return err;
314 }
315 DEVICE_ATTR(serial, S_IRUGO, virtblk_serial_show, NULL);
316
317 static void virtblk_config_changed_work(struct work_struct *work)
318 {
319         struct virtio_blk *vblk =
320                 container_of(work, struct virtio_blk, config_work);
321         struct virtio_device *vdev = vblk->vdev;
322         struct request_queue *q = vblk->disk->queue;
323         char cap_str_2[10], cap_str_10[10];
324         char *envp[] = { "RESIZE=1", NULL };
325         u64 capacity, size;
326
327         mutex_lock(&vblk->config_lock);
328         if (!vblk->config_enable)
329                 goto done;
330
331         /* Host must always specify the capacity. */
332         vdev->config->get(vdev, offsetof(struct virtio_blk_config, capacity),
333                           &capacity, sizeof(capacity));
334
335         /* If capacity is too big, truncate with warning. */
336         if ((sector_t)capacity != capacity) {
337                 dev_warn(&vdev->dev, "Capacity %llu too large: truncating\n",
338                          (unsigned long long)capacity);
339                 capacity = (sector_t)-1;
340         }
341
342         size = capacity * queue_logical_block_size(q);
343         string_get_size(size, STRING_UNITS_2, cap_str_2, sizeof(cap_str_2));
344         string_get_size(size, STRING_UNITS_10, cap_str_10, sizeof(cap_str_10));
345
346         dev_notice(&vdev->dev,
347                   "new size: %llu %d-byte logical blocks (%s/%s)\n",
348                   (unsigned long long)capacity,
349                   queue_logical_block_size(q),
350                   cap_str_10, cap_str_2);
351
352         set_capacity(vblk->disk, capacity);
353         revalidate_disk(vblk->disk);
354         kobject_uevent_env(&disk_to_dev(vblk->disk)->kobj, KOBJ_CHANGE, envp);
355 done:
356         mutex_unlock(&vblk->config_lock);
357 }
358
359 static void virtblk_config_changed(struct virtio_device *vdev)
360 {
361         struct virtio_blk *vblk = vdev->priv;
362
363         queue_work(virtblk_wq, &vblk->config_work);
364 }
365
366 static int init_vq(struct virtio_blk *vblk)
367 {
368         int err = 0;
369
370         /* We expect one virtqueue, for output. */
371         vblk->vq = virtio_find_single_vq(vblk->vdev, virtblk_done, "requests");
372         if (IS_ERR(vblk->vq))
373                 err = PTR_ERR(vblk->vq);
374
375         return err;
376 }
377
378 /*
379  * Legacy naming scheme used for virtio devices.  We are stuck with it for
380  * virtio blk but don't ever use it for any new driver.
381  */
382 static int virtblk_name_format(char *prefix, int index, char *buf, int buflen)
383 {
384         const int base = 'z' - 'a' + 1;
385         char *begin = buf + strlen(prefix);
386         char *end = buf + buflen;
387         char *p;
388         int unit;
389
390         p = end - 1;
391         *p = '\0';
392         unit = base;
393         do {
394                 if (p == begin)
395                         return -EINVAL;
396                 *--p = 'a' + (index % unit);
397                 index = (index / unit) - 1;
398         } while (index >= 0);
399
400         memmove(begin, p, end - p);
401         memcpy(buf, prefix, strlen(prefix));
402
403         return 0;
404 }
405
406 static int virtblk_get_cache_mode(struct virtio_device *vdev)
407 {
408         u8 writeback;
409         int err;
410
411         err = virtio_config_val(vdev, VIRTIO_BLK_F_CONFIG_WCE,
412                                 offsetof(struct virtio_blk_config, wce),
413                                 &writeback);
414         if (err)
415                 writeback = virtio_has_feature(vdev, VIRTIO_BLK_F_WCE);
416
417         return writeback;
418 }
419
420 static void virtblk_update_cache_mode(struct virtio_device *vdev)
421 {
422         u8 writeback = virtblk_get_cache_mode(vdev);
423         struct virtio_blk *vblk = vdev->priv;
424
425         if (writeback)
426                 blk_queue_flush(vblk->disk->queue, REQ_FLUSH);
427         else
428                 blk_queue_flush(vblk->disk->queue, 0);
429
430         revalidate_disk(vblk->disk);
431 }
432
433 static const char *const virtblk_cache_types[] = {
434         "write through", "write back"
435 };
436
437 static ssize_t
438 virtblk_cache_type_store(struct device *dev, struct device_attribute *attr,
439                          const char *buf, size_t count)
440 {
441         struct gendisk *disk = dev_to_disk(dev);
442         struct virtio_blk *vblk = disk->private_data;
443         struct virtio_device *vdev = vblk->vdev;
444         int i;
445         u8 writeback;
446
447         BUG_ON(!virtio_has_feature(vblk->vdev, VIRTIO_BLK_F_CONFIG_WCE));
448         for (i = ARRAY_SIZE(virtblk_cache_types); --i >= 0; )
449                 if (sysfs_streq(buf, virtblk_cache_types[i]))
450                         break;
451
452         if (i < 0)
453                 return -EINVAL;
454
455         writeback = i;
456         vdev->config->set(vdev,
457                           offsetof(struct virtio_blk_config, wce),
458                           &writeback, sizeof(writeback));
459
460         virtblk_update_cache_mode(vdev);
461         return count;
462 }
463
464 static ssize_t
465 virtblk_cache_type_show(struct device *dev, struct device_attribute *attr,
466                          char *buf)
467 {
468         struct gendisk *disk = dev_to_disk(dev);
469         struct virtio_blk *vblk = disk->private_data;
470         u8 writeback = virtblk_get_cache_mode(vblk->vdev);
471
472         BUG_ON(writeback >= ARRAY_SIZE(virtblk_cache_types));
473         return snprintf(buf, 40, "%s\n", virtblk_cache_types[writeback]);
474 }
475
476 static const struct device_attribute dev_attr_cache_type_ro =
477         __ATTR(cache_type, S_IRUGO,
478                virtblk_cache_type_show, NULL);
479 static const struct device_attribute dev_attr_cache_type_rw =
480         __ATTR(cache_type, S_IRUGO|S_IWUSR,
481                virtblk_cache_type_show, virtblk_cache_type_store);
482
483 static struct blk_mq_ops virtio_mq_ops = {
484         .queue_rq       = virtio_queue_rq,
485         .map_queue      = blk_mq_map_queue,
486         .alloc_hctx     = blk_mq_alloc_single_hw_queue,
487         .free_hctx      = blk_mq_free_single_hw_queue,
488 };
489
490 static struct blk_mq_reg virtio_mq_reg = {
491         .ops            = &virtio_mq_ops,
492         .nr_hw_queues   = 1,
493         .queue_depth    = 64,
494         .numa_node      = NUMA_NO_NODE,
495         .flags          = BLK_MQ_F_SHOULD_MERGE,
496 };
497
498 static void virtblk_init_vbr(void *data, struct blk_mq_hw_ctx *hctx,
499                              struct request *rq, unsigned int nr)
500 {
501         struct virtio_blk *vblk = data;
502         struct virtblk_req *vbr = rq->special;
503
504         sg_init_table(vbr->sg, vblk->sg_elems);
505 }
506
507 static int virtblk_probe(struct virtio_device *vdev)
508 {
509         struct virtio_blk *vblk;
510         struct request_queue *q;
511         int err, index;
512
513         u64 cap;
514         u32 v, blk_size, sg_elems, opt_io_size;
515         u16 min_io_size;
516         u8 physical_block_exp, alignment_offset;
517
518         err = ida_simple_get(&vd_index_ida, 0, minor_to_index(1 << MINORBITS),
519                              GFP_KERNEL);
520         if (err < 0)
521                 goto out;
522         index = err;
523
524         /* We need to know how many segments before we allocate. */
525         err = virtio_config_val(vdev, VIRTIO_BLK_F_SEG_MAX,
526                                 offsetof(struct virtio_blk_config, seg_max),
527                                 &sg_elems);
528
529         /* We need at least one SG element, whatever they say. */
530         if (err || !sg_elems)
531                 sg_elems = 1;
532
533         /* We need an extra sg elements at head and tail. */
534         sg_elems += 2;
535         vdev->priv = vblk = kmalloc(sizeof(*vblk), GFP_KERNEL);
536         if (!vblk) {
537                 err = -ENOMEM;
538                 goto out_free_index;
539         }
540
541         vblk->vdev = vdev;
542         vblk->sg_elems = sg_elems;
543         mutex_init(&vblk->config_lock);
544
545         INIT_WORK(&vblk->config_work, virtblk_config_changed_work);
546         vblk->config_enable = true;
547
548         err = init_vq(vblk);
549         if (err)
550                 goto out_free_vblk;
551         spin_lock_init(&vblk->vq_lock);
552
553         /* FIXME: How many partitions?  How long is a piece of string? */
554         vblk->disk = alloc_disk(1 << PART_BITS);
555         if (!vblk->disk) {
556                 err = -ENOMEM;
557                 goto out_free_vq;
558         }
559
560         virtio_mq_reg.cmd_size =
561                 sizeof(struct virtblk_req) +
562                 sizeof(struct scatterlist) * sg_elems;
563
564         q = vblk->disk->queue = blk_mq_init_queue(&virtio_mq_reg, vblk);
565         if (!q) {
566                 err = -ENOMEM;
567                 goto out_put_disk;
568         }
569
570         blk_mq_init_commands(q, virtblk_init_vbr, vblk);
571
572         q->queuedata = vblk;
573
574         virtblk_name_format("vd", index, vblk->disk->disk_name, DISK_NAME_LEN);
575
576         vblk->disk->major = major;
577         vblk->disk->first_minor = index_to_minor(index);
578         vblk->disk->private_data = vblk;
579         vblk->disk->fops = &virtblk_fops;
580         vblk->disk->driverfs_dev = &vdev->dev;
581         vblk->index = index;
582
583         /* configure queue flush support */
584         virtblk_update_cache_mode(vdev);
585
586         /* If disk is read-only in the host, the guest should obey */
587         if (virtio_has_feature(vdev, VIRTIO_BLK_F_RO))
588                 set_disk_ro(vblk->disk, 1);
589
590         /* Host must always specify the capacity. */
591         vdev->config->get(vdev, offsetof(struct virtio_blk_config, capacity),
592                           &cap, sizeof(cap));
593
594         /* If capacity is too big, truncate with warning. */
595         if ((sector_t)cap != cap) {
596                 dev_warn(&vdev->dev, "Capacity %llu too large: truncating\n",
597                          (unsigned long long)cap);
598                 cap = (sector_t)-1;
599         }
600         set_capacity(vblk->disk, cap);
601
602         /* We can handle whatever the host told us to handle. */
603         blk_queue_max_segments(q, vblk->sg_elems-2);
604
605         /* No need to bounce any requests */
606         blk_queue_bounce_limit(q, BLK_BOUNCE_ANY);
607
608         /* No real sector limit. */
609         blk_queue_max_hw_sectors(q, -1U);
610
611         /* Host can optionally specify maximum segment size and number of
612          * segments. */
613         err = virtio_config_val(vdev, VIRTIO_BLK_F_SIZE_MAX,
614                                 offsetof(struct virtio_blk_config, size_max),
615                                 &v);
616         if (!err)
617                 blk_queue_max_segment_size(q, v);
618         else
619                 blk_queue_max_segment_size(q, -1U);
620
621         /* Host can optionally specify the block size of the device */
622         err = virtio_config_val(vdev, VIRTIO_BLK_F_BLK_SIZE,
623                                 offsetof(struct virtio_blk_config, blk_size),
624                                 &blk_size);
625         if (!err)
626                 blk_queue_logical_block_size(q, blk_size);
627         else
628                 blk_size = queue_logical_block_size(q);
629
630         /* Use topology information if available */
631         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
632                         offsetof(struct virtio_blk_config, physical_block_exp),
633                         &physical_block_exp);
634         if (!err && physical_block_exp)
635                 blk_queue_physical_block_size(q,
636                                 blk_size * (1 << physical_block_exp));
637
638         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
639                         offsetof(struct virtio_blk_config, alignment_offset),
640                         &alignment_offset);
641         if (!err && alignment_offset)
642                 blk_queue_alignment_offset(q, blk_size * alignment_offset);
643
644         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
645                         offsetof(struct virtio_blk_config, min_io_size),
646                         &min_io_size);
647         if (!err && min_io_size)
648                 blk_queue_io_min(q, blk_size * min_io_size);
649
650         err = virtio_config_val(vdev, VIRTIO_BLK_F_TOPOLOGY,
651                         offsetof(struct virtio_blk_config, opt_io_size),
652                         &opt_io_size);
653         if (!err && opt_io_size)
654                 blk_queue_io_opt(q, blk_size * opt_io_size);
655
656         add_disk(vblk->disk);
657         err = device_create_file(disk_to_dev(vblk->disk), &dev_attr_serial);
658         if (err)
659                 goto out_del_disk;
660
661         if (virtio_has_feature(vdev, VIRTIO_BLK_F_CONFIG_WCE))
662                 err = device_create_file(disk_to_dev(vblk->disk),
663                                          &dev_attr_cache_type_rw);
664         else
665                 err = device_create_file(disk_to_dev(vblk->disk),
666                                          &dev_attr_cache_type_ro);
667         if (err)
668                 goto out_del_disk;
669         return 0;
670
671 out_del_disk:
672         del_gendisk(vblk->disk);
673         blk_cleanup_queue(vblk->disk->queue);
674 out_put_disk:
675         put_disk(vblk->disk);
676 out_free_vq:
677         vdev->config->del_vqs(vdev);
678 out_free_vblk:
679         kfree(vblk);
680 out_free_index:
681         ida_simple_remove(&vd_index_ida, index);
682 out:
683         return err;
684 }
685
686 static void virtblk_remove(struct virtio_device *vdev)
687 {
688         struct virtio_blk *vblk = vdev->priv;
689         int index = vblk->index;
690         int refc;
691
692         /* Prevent config work handler from accessing the device. */
693         mutex_lock(&vblk->config_lock);
694         vblk->config_enable = false;
695         mutex_unlock(&vblk->config_lock);
696
697         del_gendisk(vblk->disk);
698         blk_cleanup_queue(vblk->disk->queue);
699
700         /* Stop all the virtqueues. */
701         vdev->config->reset(vdev);
702
703         flush_work(&vblk->config_work);
704
705         refc = atomic_read(&disk_to_dev(vblk->disk)->kobj.kref.refcount);
706         put_disk(vblk->disk);
707         vdev->config->del_vqs(vdev);
708         kfree(vblk);
709
710         /* Only free device id if we don't have any users */
711         if (refc == 1)
712                 ida_simple_remove(&vd_index_ida, index);
713 }
714
715 #ifdef CONFIG_PM
716 static int virtblk_freeze(struct virtio_device *vdev)
717 {
718         struct virtio_blk *vblk = vdev->priv;
719
720         /* Ensure we don't receive any more interrupts */
721         vdev->config->reset(vdev);
722
723         /* Prevent config work handler from accessing the device. */
724         mutex_lock(&vblk->config_lock);
725         vblk->config_enable = false;
726         mutex_unlock(&vblk->config_lock);
727
728         flush_work(&vblk->config_work);
729
730         blk_mq_stop_hw_queues(vblk->disk->queue);
731
732         vdev->config->del_vqs(vdev);
733         return 0;
734 }
735
736 static int virtblk_restore(struct virtio_device *vdev)
737 {
738         struct virtio_blk *vblk = vdev->priv;
739         int ret;
740
741         vblk->config_enable = true;
742         ret = init_vq(vdev->priv);
743         if (!ret)
744                 blk_mq_start_stopped_hw_queues(vblk->disk->queue);
745
746         return ret;
747 }
748 #endif
749
750 static const struct virtio_device_id id_table[] = {
751         { VIRTIO_ID_BLOCK, VIRTIO_DEV_ANY_ID },
752         { 0 },
753 };
754
755 static unsigned int features[] = {
756         VIRTIO_BLK_F_SEG_MAX, VIRTIO_BLK_F_SIZE_MAX, VIRTIO_BLK_F_GEOMETRY,
757         VIRTIO_BLK_F_RO, VIRTIO_BLK_F_BLK_SIZE, VIRTIO_BLK_F_SCSI,
758         VIRTIO_BLK_F_WCE, VIRTIO_BLK_F_TOPOLOGY, VIRTIO_BLK_F_CONFIG_WCE
759 };
760
761 static struct virtio_driver virtio_blk = {
762         .feature_table          = features,
763         .feature_table_size     = ARRAY_SIZE(features),
764         .driver.name            = KBUILD_MODNAME,
765         .driver.owner           = THIS_MODULE,
766         .id_table               = id_table,
767         .probe                  = virtblk_probe,
768         .remove                 = virtblk_remove,
769         .config_changed         = virtblk_config_changed,
770 #ifdef CONFIG_PM
771         .freeze                 = virtblk_freeze,
772         .restore                = virtblk_restore,
773 #endif
774 };
775
776 static int __init init(void)
777 {
778         int error;
779
780         virtblk_wq = alloc_workqueue("virtio-blk", 0, 0);
781         if (!virtblk_wq)
782                 return -ENOMEM;
783
784         major = register_blkdev(0, "virtblk");
785         if (major < 0) {
786                 error = major;
787                 goto out_destroy_workqueue;
788         }
789
790         error = register_virtio_driver(&virtio_blk);
791         if (error)
792                 goto out_unregister_blkdev;
793         return 0;
794
795 out_unregister_blkdev:
796         unregister_blkdev(major, "virtblk");
797 out_destroy_workqueue:
798         destroy_workqueue(virtblk_wq);
799         return error;
800 }
801
802 static void __exit fini(void)
803 {
804         unregister_blkdev(major, "virtblk");
805         unregister_virtio_driver(&virtio_blk);
806         destroy_workqueue(virtblk_wq);
807 }
808 module_init(init);
809 module_exit(fini);
810
811 MODULE_DEVICE_TABLE(virtio, id_table);
812 MODULE_DESCRIPTION("Virtio block driver");
813 MODULE_LICENSE("GPL");