Merge remote-tracking branches 'asoc/topic/tdm-slot', 'asoc/topic/tegra', 'asoc/topic...
[cascardo/linux.git] / drivers / ata / libata-eh.c
1 /*
2  *  libata-eh.c - libata error handling
3  *
4  *  Maintained by:  Tejun Heo <tj@kernel.org>
5  *                  Please ALWAYS copy linux-ide@vger.kernel.org
6  *                  on emails.
7  *
8  *  Copyright 2006 Tejun Heo <htejun@gmail.com>
9  *
10  *
11  *  This program is free software; you can redistribute it and/or
12  *  modify it under the terms of the GNU General Public License as
13  *  published by the Free Software Foundation; either version 2, or
14  *  (at your option) any later version.
15  *
16  *  This program is distributed in the hope that it will be useful,
17  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
18  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  *  General Public License for more details.
20  *
21  *  You should have received a copy of the GNU General Public License
22  *  along with this program; see the file COPYING.  If not, write to
23  *  the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139,
24  *  USA.
25  *
26  *
27  *  libata documentation is available via 'make {ps|pdf}docs',
28  *  as Documentation/DocBook/libata.*
29  *
30  *  Hardware documentation available from http://www.t13.org/ and
31  *  http://www.sata-io.org/
32  *
33  */
34
35 #include <linux/kernel.h>
36 #include <linux/blkdev.h>
37 #include <linux/export.h>
38 #include <linux/pci.h>
39 #include <scsi/scsi.h>
40 #include <scsi/scsi_host.h>
41 #include <scsi/scsi_eh.h>
42 #include <scsi/scsi_device.h>
43 #include <scsi/scsi_cmnd.h>
44 #include <scsi/scsi_dbg.h>
45 #include "../scsi/scsi_transport_api.h"
46
47 #include <linux/libata.h>
48
49 #include "libata.h"
50
51 enum {
52         /* speed down verdicts */
53         ATA_EH_SPDN_NCQ_OFF             = (1 << 0),
54         ATA_EH_SPDN_SPEED_DOWN          = (1 << 1),
55         ATA_EH_SPDN_FALLBACK_TO_PIO     = (1 << 2),
56         ATA_EH_SPDN_KEEP_ERRORS         = (1 << 3),
57
58         /* error flags */
59         ATA_EFLAG_IS_IO                 = (1 << 0),
60         ATA_EFLAG_DUBIOUS_XFER          = (1 << 1),
61         ATA_EFLAG_OLD_ER                = (1 << 31),
62
63         /* error categories */
64         ATA_ECAT_NONE                   = 0,
65         ATA_ECAT_ATA_BUS                = 1,
66         ATA_ECAT_TOUT_HSM               = 2,
67         ATA_ECAT_UNK_DEV                = 3,
68         ATA_ECAT_DUBIOUS_NONE           = 4,
69         ATA_ECAT_DUBIOUS_ATA_BUS        = 5,
70         ATA_ECAT_DUBIOUS_TOUT_HSM       = 6,
71         ATA_ECAT_DUBIOUS_UNK_DEV        = 7,
72         ATA_ECAT_NR                     = 8,
73
74         ATA_EH_CMD_DFL_TIMEOUT          =  5000,
75
76         /* always put at least this amount of time between resets */
77         ATA_EH_RESET_COOL_DOWN          =  5000,
78
79         /* Waiting in ->prereset can never be reliable.  It's
80          * sometimes nice to wait there but it can't be depended upon;
81          * otherwise, we wouldn't be resetting.  Just give it enough
82          * time for most drives to spin up.
83          */
84         ATA_EH_PRERESET_TIMEOUT         = 10000,
85         ATA_EH_FASTDRAIN_INTERVAL       =  3000,
86
87         ATA_EH_UA_TRIES                 = 5,
88
89         /* probe speed down parameters, see ata_eh_schedule_probe() */
90         ATA_EH_PROBE_TRIAL_INTERVAL     = 60000,        /* 1 min */
91         ATA_EH_PROBE_TRIALS             = 2,
92 };
93
94 /* The following table determines how we sequence resets.  Each entry
95  * represents timeout for that try.  The first try can be soft or
96  * hardreset.  All others are hardreset if available.  In most cases
97  * the first reset w/ 10sec timeout should succeed.  Following entries
98  * are mostly for error handling, hotplug and those outlier devices that
99  * take an exceptionally long time to recover from reset.
100  */
101 static const unsigned long ata_eh_reset_timeouts[] = {
102         10000,  /* most drives spin up by 10sec */
103         10000,  /* > 99% working drives spin up before 20sec */
104         35000,  /* give > 30 secs of idleness for outlier devices */
105          5000,  /* and sweet one last chance */
106         ULONG_MAX, /* > 1 min has elapsed, give up */
107 };
108
109 static const unsigned long ata_eh_identify_timeouts[] = {
110          5000,  /* covers > 99% of successes and not too boring on failures */
111         10000,  /* combined time till here is enough even for media access */
112         30000,  /* for true idiots */
113         ULONG_MAX,
114 };
115
116 static const unsigned long ata_eh_flush_timeouts[] = {
117         15000,  /* be generous with flush */
118         15000,  /* ditto */
119         30000,  /* and even more generous */
120         ULONG_MAX,
121 };
122
123 static const unsigned long ata_eh_other_timeouts[] = {
124          5000,  /* same rationale as identify timeout */
125         10000,  /* ditto */
126         /* but no merciful 30sec for other commands, it just isn't worth it */
127         ULONG_MAX,
128 };
129
130 struct ata_eh_cmd_timeout_ent {
131         const u8                *commands;
132         const unsigned long     *timeouts;
133 };
134
135 /* The following table determines timeouts to use for EH internal
136  * commands.  Each table entry is a command class and matches the
137  * commands the entry applies to and the timeout table to use.
138  *
139  * On the retry after a command timed out, the next timeout value from
140  * the table is used.  If the table doesn't contain further entries,
141  * the last value is used.
142  *
143  * ehc->cmd_timeout_idx keeps track of which timeout to use per
144  * command class, so if SET_FEATURES times out on the first try, the
145  * next try will use the second timeout value only for that class.
146  */
147 #define CMDS(cmds...)   (const u8 []){ cmds, 0 }
148 static const struct ata_eh_cmd_timeout_ent
149 ata_eh_cmd_timeout_table[ATA_EH_CMD_TIMEOUT_TABLE_SIZE] = {
150         { .commands = CMDS(ATA_CMD_ID_ATA, ATA_CMD_ID_ATAPI),
151           .timeouts = ata_eh_identify_timeouts, },
152         { .commands = CMDS(ATA_CMD_READ_NATIVE_MAX, ATA_CMD_READ_NATIVE_MAX_EXT),
153           .timeouts = ata_eh_other_timeouts, },
154         { .commands = CMDS(ATA_CMD_SET_MAX, ATA_CMD_SET_MAX_EXT),
155           .timeouts = ata_eh_other_timeouts, },
156         { .commands = CMDS(ATA_CMD_SET_FEATURES),
157           .timeouts = ata_eh_other_timeouts, },
158         { .commands = CMDS(ATA_CMD_INIT_DEV_PARAMS),
159           .timeouts = ata_eh_other_timeouts, },
160         { .commands = CMDS(ATA_CMD_FLUSH, ATA_CMD_FLUSH_EXT),
161           .timeouts = ata_eh_flush_timeouts },
162 };
163 #undef CMDS
164
165 static void __ata_port_freeze(struct ata_port *ap);
166 #ifdef CONFIG_PM
167 static void ata_eh_handle_port_suspend(struct ata_port *ap);
168 static void ata_eh_handle_port_resume(struct ata_port *ap);
169 #else /* CONFIG_PM */
170 static void ata_eh_handle_port_suspend(struct ata_port *ap)
171 { }
172
173 static void ata_eh_handle_port_resume(struct ata_port *ap)
174 { }
175 #endif /* CONFIG_PM */
176
177 static void __ata_ehi_pushv_desc(struct ata_eh_info *ehi, const char *fmt,
178                                  va_list args)
179 {
180         ehi->desc_len += vscnprintf(ehi->desc + ehi->desc_len,
181                                      ATA_EH_DESC_LEN - ehi->desc_len,
182                                      fmt, args);
183 }
184
185 /**
186  *      __ata_ehi_push_desc - push error description without adding separator
187  *      @ehi: target EHI
188  *      @fmt: printf format string
189  *
190  *      Format string according to @fmt and append it to @ehi->desc.
191  *
192  *      LOCKING:
193  *      spin_lock_irqsave(host lock)
194  */
195 void __ata_ehi_push_desc(struct ata_eh_info *ehi, const char *fmt, ...)
196 {
197         va_list args;
198
199         va_start(args, fmt);
200         __ata_ehi_pushv_desc(ehi, fmt, args);
201         va_end(args);
202 }
203
204 /**
205  *      ata_ehi_push_desc - push error description with separator
206  *      @ehi: target EHI
207  *      @fmt: printf format string
208  *
209  *      Format string according to @fmt and append it to @ehi->desc.
210  *      If @ehi->desc is not empty, ", " is added in-between.
211  *
212  *      LOCKING:
213  *      spin_lock_irqsave(host lock)
214  */
215 void ata_ehi_push_desc(struct ata_eh_info *ehi, const char *fmt, ...)
216 {
217         va_list args;
218
219         if (ehi->desc_len)
220                 __ata_ehi_push_desc(ehi, ", ");
221
222         va_start(args, fmt);
223         __ata_ehi_pushv_desc(ehi, fmt, args);
224         va_end(args);
225 }
226
227 /**
228  *      ata_ehi_clear_desc - clean error description
229  *      @ehi: target EHI
230  *
231  *      Clear @ehi->desc.
232  *
233  *      LOCKING:
234  *      spin_lock_irqsave(host lock)
235  */
236 void ata_ehi_clear_desc(struct ata_eh_info *ehi)
237 {
238         ehi->desc[0] = '\0';
239         ehi->desc_len = 0;
240 }
241
242 /**
243  *      ata_port_desc - append port description
244  *      @ap: target ATA port
245  *      @fmt: printf format string
246  *
247  *      Format string according to @fmt and append it to port
248  *      description.  If port description is not empty, " " is added
249  *      in-between.  This function is to be used while initializing
250  *      ata_host.  The description is printed on host registration.
251  *
252  *      LOCKING:
253  *      None.
254  */
255 void ata_port_desc(struct ata_port *ap, const char *fmt, ...)
256 {
257         va_list args;
258
259         WARN_ON(!(ap->pflags & ATA_PFLAG_INITIALIZING));
260
261         if (ap->link.eh_info.desc_len)
262                 __ata_ehi_push_desc(&ap->link.eh_info, " ");
263
264         va_start(args, fmt);
265         __ata_ehi_pushv_desc(&ap->link.eh_info, fmt, args);
266         va_end(args);
267 }
268
269 #ifdef CONFIG_PCI
270
271 /**
272  *      ata_port_pbar_desc - append PCI BAR description
273  *      @ap: target ATA port
274  *      @bar: target PCI BAR
275  *      @offset: offset into PCI BAR
276  *      @name: name of the area
277  *
278  *      If @offset is negative, this function formats a string which
279  *      contains the name, address, size and type of the BAR and
280  *      appends it to the port description.  If @offset is zero or
281  *      positive, only name and offsetted address is appended.
282  *
283  *      LOCKING:
284  *      None.
285  */
286 void ata_port_pbar_desc(struct ata_port *ap, int bar, ssize_t offset,
287                         const char *name)
288 {
289         struct pci_dev *pdev = to_pci_dev(ap->host->dev);
290         char *type = "";
291         unsigned long long start, len;
292
293         if (pci_resource_flags(pdev, bar) & IORESOURCE_MEM)
294                 type = "m";
295         else if (pci_resource_flags(pdev, bar) & IORESOURCE_IO)
296                 type = "i";
297
298         start = (unsigned long long)pci_resource_start(pdev, bar);
299         len = (unsigned long long)pci_resource_len(pdev, bar);
300
301         if (offset < 0)
302                 ata_port_desc(ap, "%s %s%llu@0x%llx", name, type, len, start);
303         else
304                 ata_port_desc(ap, "%s 0x%llx", name,
305                                 start + (unsigned long long)offset);
306 }
307
308 #endif /* CONFIG_PCI */
309
310 static int ata_lookup_timeout_table(u8 cmd)
311 {
312         int i;
313
314         for (i = 0; i < ATA_EH_CMD_TIMEOUT_TABLE_SIZE; i++) {
315                 const u8 *cur;
316
317                 for (cur = ata_eh_cmd_timeout_table[i].commands; *cur; cur++)
318                         if (*cur == cmd)
319                                 return i;
320         }
321
322         return -1;
323 }
324
325 /**
326  *      ata_internal_cmd_timeout - determine timeout for an internal command
327  *      @dev: target device
328  *      @cmd: internal command to be issued
329  *
330  *      Determine timeout for internal command @cmd for @dev.
331  *
332  *      LOCKING:
333  *      EH context.
334  *
335  *      RETURNS:
336  *      Determined timeout.
337  */
338 unsigned long ata_internal_cmd_timeout(struct ata_device *dev, u8 cmd)
339 {
340         struct ata_eh_context *ehc = &dev->link->eh_context;
341         int ent = ata_lookup_timeout_table(cmd);
342         int idx;
343
344         if (ent < 0)
345                 return ATA_EH_CMD_DFL_TIMEOUT;
346
347         idx = ehc->cmd_timeout_idx[dev->devno][ent];
348         return ata_eh_cmd_timeout_table[ent].timeouts[idx];
349 }
350
351 /**
352  *      ata_internal_cmd_timed_out - notification for internal command timeout
353  *      @dev: target device
354  *      @cmd: internal command which timed out
355  *
356  *      Notify EH that internal command @cmd for @dev timed out.  This
357  *      function should be called only for commands whose timeouts are
358  *      determined using ata_internal_cmd_timeout().
359  *
360  *      LOCKING:
361  *      EH context.
362  */
363 void ata_internal_cmd_timed_out(struct ata_device *dev, u8 cmd)
364 {
365         struct ata_eh_context *ehc = &dev->link->eh_context;
366         int ent = ata_lookup_timeout_table(cmd);
367         int idx;
368
369         if (ent < 0)
370                 return;
371
372         idx = ehc->cmd_timeout_idx[dev->devno][ent];
373         if (ata_eh_cmd_timeout_table[ent].timeouts[idx + 1] != ULONG_MAX)
374                 ehc->cmd_timeout_idx[dev->devno][ent]++;
375 }
376
377 static void ata_ering_record(struct ata_ering *ering, unsigned int eflags,
378                              unsigned int err_mask)
379 {
380         struct ata_ering_entry *ent;
381
382         WARN_ON(!err_mask);
383
384         ering->cursor++;
385         ering->cursor %= ATA_ERING_SIZE;
386
387         ent = &ering->ring[ering->cursor];
388         ent->eflags = eflags;
389         ent->err_mask = err_mask;
390         ent->timestamp = get_jiffies_64();
391 }
392
393 static struct ata_ering_entry *ata_ering_top(struct ata_ering *ering)
394 {
395         struct ata_ering_entry *ent = &ering->ring[ering->cursor];
396
397         if (ent->err_mask)
398                 return ent;
399         return NULL;
400 }
401
402 int ata_ering_map(struct ata_ering *ering,
403                   int (*map_fn)(struct ata_ering_entry *, void *),
404                   void *arg)
405 {
406         int idx, rc = 0;
407         struct ata_ering_entry *ent;
408
409         idx = ering->cursor;
410         do {
411                 ent = &ering->ring[idx];
412                 if (!ent->err_mask)
413                         break;
414                 rc = map_fn(ent, arg);
415                 if (rc)
416                         break;
417                 idx = (idx - 1 + ATA_ERING_SIZE) % ATA_ERING_SIZE;
418         } while (idx != ering->cursor);
419
420         return rc;
421 }
422
423 static int ata_ering_clear_cb(struct ata_ering_entry *ent, void *void_arg)
424 {
425         ent->eflags |= ATA_EFLAG_OLD_ER;
426         return 0;
427 }
428
429 static void ata_ering_clear(struct ata_ering *ering)
430 {
431         ata_ering_map(ering, ata_ering_clear_cb, NULL);
432 }
433
434 static unsigned int ata_eh_dev_action(struct ata_device *dev)
435 {
436         struct ata_eh_context *ehc = &dev->link->eh_context;
437
438         return ehc->i.action | ehc->i.dev_action[dev->devno];
439 }
440
441 static void ata_eh_clear_action(struct ata_link *link, struct ata_device *dev,
442                                 struct ata_eh_info *ehi, unsigned int action)
443 {
444         struct ata_device *tdev;
445
446         if (!dev) {
447                 ehi->action &= ~action;
448                 ata_for_each_dev(tdev, link, ALL)
449                         ehi->dev_action[tdev->devno] &= ~action;
450         } else {
451                 /* doesn't make sense for port-wide EH actions */
452                 WARN_ON(!(action & ATA_EH_PERDEV_MASK));
453
454                 /* break ehi->action into ehi->dev_action */
455                 if (ehi->action & action) {
456                         ata_for_each_dev(tdev, link, ALL)
457                                 ehi->dev_action[tdev->devno] |=
458                                         ehi->action & action;
459                         ehi->action &= ~action;
460                 }
461
462                 /* turn off the specified per-dev action */
463                 ehi->dev_action[dev->devno] &= ~action;
464         }
465 }
466
467 /**
468  *      ata_eh_acquire - acquire EH ownership
469  *      @ap: ATA port to acquire EH ownership for
470  *
471  *      Acquire EH ownership for @ap.  This is the basic exclusion
472  *      mechanism for ports sharing a host.  Only one port hanging off
473  *      the same host can claim the ownership of EH.
474  *
475  *      LOCKING:
476  *      EH context.
477  */
478 void ata_eh_acquire(struct ata_port *ap)
479 {
480         mutex_lock(&ap->host->eh_mutex);
481         WARN_ON_ONCE(ap->host->eh_owner);
482         ap->host->eh_owner = current;
483 }
484
485 /**
486  *      ata_eh_release - release EH ownership
487  *      @ap: ATA port to release EH ownership for
488  *
489  *      Release EH ownership for @ap if the caller.  The caller must
490  *      have acquired EH ownership using ata_eh_acquire() previously.
491  *
492  *      LOCKING:
493  *      EH context.
494  */
495 void ata_eh_release(struct ata_port *ap)
496 {
497         WARN_ON_ONCE(ap->host->eh_owner != current);
498         ap->host->eh_owner = NULL;
499         mutex_unlock(&ap->host->eh_mutex);
500 }
501
502 /**
503  *      ata_scsi_timed_out - SCSI layer time out callback
504  *      @cmd: timed out SCSI command
505  *
506  *      Handles SCSI layer timeout.  We race with normal completion of
507  *      the qc for @cmd.  If the qc is already gone, we lose and let
508  *      the scsi command finish (EH_HANDLED).  Otherwise, the qc has
509  *      timed out and EH should be invoked.  Prevent ata_qc_complete()
510  *      from finishing it by setting EH_SCHEDULED and return
511  *      EH_NOT_HANDLED.
512  *
513  *      TODO: kill this function once old EH is gone.
514  *
515  *      LOCKING:
516  *      Called from timer context
517  *
518  *      RETURNS:
519  *      EH_HANDLED or EH_NOT_HANDLED
520  */
521 enum blk_eh_timer_return ata_scsi_timed_out(struct scsi_cmnd *cmd)
522 {
523         struct Scsi_Host *host = cmd->device->host;
524         struct ata_port *ap = ata_shost_to_port(host);
525         unsigned long flags;
526         struct ata_queued_cmd *qc;
527         enum blk_eh_timer_return ret;
528
529         DPRINTK("ENTER\n");
530
531         if (ap->ops->error_handler) {
532                 ret = BLK_EH_NOT_HANDLED;
533                 goto out;
534         }
535
536         ret = BLK_EH_HANDLED;
537         spin_lock_irqsave(ap->lock, flags);
538         qc = ata_qc_from_tag(ap, ap->link.active_tag);
539         if (qc) {
540                 WARN_ON(qc->scsicmd != cmd);
541                 qc->flags |= ATA_QCFLAG_EH_SCHEDULED;
542                 qc->err_mask |= AC_ERR_TIMEOUT;
543                 ret = BLK_EH_NOT_HANDLED;
544         }
545         spin_unlock_irqrestore(ap->lock, flags);
546
547  out:
548         DPRINTK("EXIT, ret=%d\n", ret);
549         return ret;
550 }
551
552 static void ata_eh_unload(struct ata_port *ap)
553 {
554         struct ata_link *link;
555         struct ata_device *dev;
556         unsigned long flags;
557
558         /* Restore SControl IPM and SPD for the next driver and
559          * disable attached devices.
560          */
561         ata_for_each_link(link, ap, PMP_FIRST) {
562                 sata_scr_write(link, SCR_CONTROL, link->saved_scontrol & 0xff0);
563                 ata_for_each_dev(dev, link, ALL)
564                         ata_dev_disable(dev);
565         }
566
567         /* freeze and set UNLOADED */
568         spin_lock_irqsave(ap->lock, flags);
569
570         ata_port_freeze(ap);                    /* won't be thawed */
571         ap->pflags &= ~ATA_PFLAG_EH_PENDING;    /* clear pending from freeze */
572         ap->pflags |= ATA_PFLAG_UNLOADED;
573
574         spin_unlock_irqrestore(ap->lock, flags);
575 }
576
577 /**
578  *      ata_scsi_error - SCSI layer error handler callback
579  *      @host: SCSI host on which error occurred
580  *
581  *      Handles SCSI-layer-thrown error events.
582  *
583  *      LOCKING:
584  *      Inherited from SCSI layer (none, can sleep)
585  *
586  *      RETURNS:
587  *      Zero.
588  */
589 void ata_scsi_error(struct Scsi_Host *host)
590 {
591         struct ata_port *ap = ata_shost_to_port(host);
592         unsigned long flags;
593         LIST_HEAD(eh_work_q);
594
595         DPRINTK("ENTER\n");
596
597         spin_lock_irqsave(host->host_lock, flags);
598         list_splice_init(&host->eh_cmd_q, &eh_work_q);
599         spin_unlock_irqrestore(host->host_lock, flags);
600
601         ata_scsi_cmd_error_handler(host, ap, &eh_work_q);
602
603         /* If we timed raced normal completion and there is nothing to
604            recover nr_timedout == 0 why exactly are we doing error recovery ? */
605         ata_scsi_port_error_handler(host, ap);
606
607         /* finish or retry handled scmd's and clean up */
608         WARN_ON(host->host_failed || !list_empty(&eh_work_q));
609
610         DPRINTK("EXIT\n");
611 }
612
613 /**
614  * ata_scsi_cmd_error_handler - error callback for a list of commands
615  * @host:       scsi host containing the port
616  * @ap:         ATA port within the host
617  * @eh_work_q:  list of commands to process
618  *
619  * process the given list of commands and return those finished to the
620  * ap->eh_done_q.  This function is the first part of the libata error
621  * handler which processes a given list of failed commands.
622  */
623 void ata_scsi_cmd_error_handler(struct Scsi_Host *host, struct ata_port *ap,
624                                 struct list_head *eh_work_q)
625 {
626         int i;
627         unsigned long flags;
628
629         /* make sure sff pio task is not running */
630         ata_sff_flush_pio_task(ap);
631
632         /* synchronize with host lock and sort out timeouts */
633
634         /* For new EH, all qcs are finished in one of three ways -
635          * normal completion, error completion, and SCSI timeout.
636          * Both completions can race against SCSI timeout.  When normal
637          * completion wins, the qc never reaches EH.  When error
638          * completion wins, the qc has ATA_QCFLAG_FAILED set.
639          *
640          * When SCSI timeout wins, things are a bit more complex.
641          * Normal or error completion can occur after the timeout but
642          * before this point.  In such cases, both types of
643          * completions are honored.  A scmd is determined to have
644          * timed out iff its associated qc is active and not failed.
645          */
646         if (ap->ops->error_handler) {
647                 struct scsi_cmnd *scmd, *tmp;
648                 int nr_timedout = 0;
649
650                 spin_lock_irqsave(ap->lock, flags);
651
652                 /* This must occur under the ap->lock as we don't want
653                    a polled recovery to race the real interrupt handler
654
655                    The lost_interrupt handler checks for any completed but
656                    non-notified command and completes much like an IRQ handler.
657
658                    We then fall into the error recovery code which will treat
659                    this as if normal completion won the race */
660
661                 if (ap->ops->lost_interrupt)
662                         ap->ops->lost_interrupt(ap);
663
664                 list_for_each_entry_safe(scmd, tmp, eh_work_q, eh_entry) {
665                         struct ata_queued_cmd *qc;
666
667                         for (i = 0; i < ATA_MAX_QUEUE; i++) {
668                                 qc = __ata_qc_from_tag(ap, i);
669                                 if (qc->flags & ATA_QCFLAG_ACTIVE &&
670                                     qc->scsicmd == scmd)
671                                         break;
672                         }
673
674                         if (i < ATA_MAX_QUEUE) {
675                                 /* the scmd has an associated qc */
676                                 if (!(qc->flags & ATA_QCFLAG_FAILED)) {
677                                         /* which hasn't failed yet, timeout */
678                                         qc->err_mask |= AC_ERR_TIMEOUT;
679                                         qc->flags |= ATA_QCFLAG_FAILED;
680                                         nr_timedout++;
681                                 }
682                         } else {
683                                 /* Normal completion occurred after
684                                  * SCSI timeout but before this point.
685                                  * Successfully complete it.
686                                  */
687                                 scmd->retries = scmd->allowed;
688                                 scsi_eh_finish_cmd(scmd, &ap->eh_done_q);
689                         }
690                 }
691
692                 /* If we have timed out qcs.  They belong to EH from
693                  * this point but the state of the controller is
694                  * unknown.  Freeze the port to make sure the IRQ
695                  * handler doesn't diddle with those qcs.  This must
696                  * be done atomically w.r.t. setting QCFLAG_FAILED.
697                  */
698                 if (nr_timedout)
699                         __ata_port_freeze(ap);
700
701                 spin_unlock_irqrestore(ap->lock, flags);
702
703                 /* initialize eh_tries */
704                 ap->eh_tries = ATA_EH_MAX_TRIES;
705         } else
706                 spin_unlock_wait(ap->lock);
707
708 }
709 EXPORT_SYMBOL(ata_scsi_cmd_error_handler);
710
711 /**
712  * ata_scsi_port_error_handler - recover the port after the commands
713  * @host:       SCSI host containing the port
714  * @ap:         the ATA port
715  *
716  * Handle the recovery of the port @ap after all the commands
717  * have been recovered.
718  */
719 void ata_scsi_port_error_handler(struct Scsi_Host *host, struct ata_port *ap)
720 {
721         unsigned long flags;
722
723         /* invoke error handler */
724         if (ap->ops->error_handler) {
725                 struct ata_link *link;
726
727                 /* acquire EH ownership */
728                 ata_eh_acquire(ap);
729  repeat:
730                 /* kill fast drain timer */
731                 del_timer_sync(&ap->fastdrain_timer);
732
733                 /* process port resume request */
734                 ata_eh_handle_port_resume(ap);
735
736                 /* fetch & clear EH info */
737                 spin_lock_irqsave(ap->lock, flags);
738
739                 ata_for_each_link(link, ap, HOST_FIRST) {
740                         struct ata_eh_context *ehc = &link->eh_context;
741                         struct ata_device *dev;
742
743                         memset(&link->eh_context, 0, sizeof(link->eh_context));
744                         link->eh_context.i = link->eh_info;
745                         memset(&link->eh_info, 0, sizeof(link->eh_info));
746
747                         ata_for_each_dev(dev, link, ENABLED) {
748                                 int devno = dev->devno;
749
750                                 ehc->saved_xfer_mode[devno] = dev->xfer_mode;
751                                 if (ata_ncq_enabled(dev))
752                                         ehc->saved_ncq_enabled |= 1 << devno;
753                         }
754                 }
755
756                 ap->pflags |= ATA_PFLAG_EH_IN_PROGRESS;
757                 ap->pflags &= ~ATA_PFLAG_EH_PENDING;
758                 ap->excl_link = NULL;   /* don't maintain exclusion over EH */
759
760                 spin_unlock_irqrestore(ap->lock, flags);
761
762                 /* invoke EH, skip if unloading or suspended */
763                 if (!(ap->pflags & (ATA_PFLAG_UNLOADING | ATA_PFLAG_SUSPENDED)))
764                         ap->ops->error_handler(ap);
765                 else {
766                         /* if unloading, commence suicide */
767                         if ((ap->pflags & ATA_PFLAG_UNLOADING) &&
768                             !(ap->pflags & ATA_PFLAG_UNLOADED))
769                                 ata_eh_unload(ap);
770                         ata_eh_finish(ap);
771                 }
772
773                 /* process port suspend request */
774                 ata_eh_handle_port_suspend(ap);
775
776                 /* Exception might have happened after ->error_handler
777                  * recovered the port but before this point.  Repeat
778                  * EH in such case.
779                  */
780                 spin_lock_irqsave(ap->lock, flags);
781
782                 if (ap->pflags & ATA_PFLAG_EH_PENDING) {
783                         if (--ap->eh_tries) {
784                                 spin_unlock_irqrestore(ap->lock, flags);
785                                 goto repeat;
786                         }
787                         ata_port_err(ap,
788                                      "EH pending after %d tries, giving up\n",
789                                      ATA_EH_MAX_TRIES);
790                         ap->pflags &= ~ATA_PFLAG_EH_PENDING;
791                 }
792
793                 /* this run is complete, make sure EH info is clear */
794                 ata_for_each_link(link, ap, HOST_FIRST)
795                         memset(&link->eh_info, 0, sizeof(link->eh_info));
796
797                 /* end eh (clear host_eh_scheduled) while holding
798                  * ap->lock such that if exception occurs after this
799                  * point but before EH completion, SCSI midlayer will
800                  * re-initiate EH.
801                  */
802                 ap->ops->end_eh(ap);
803
804                 spin_unlock_irqrestore(ap->lock, flags);
805                 ata_eh_release(ap);
806         } else {
807                 WARN_ON(ata_qc_from_tag(ap, ap->link.active_tag) == NULL);
808                 ap->ops->eng_timeout(ap);
809         }
810
811         scsi_eh_flush_done_q(&ap->eh_done_q);
812
813         /* clean up */
814         spin_lock_irqsave(ap->lock, flags);
815
816         if (ap->pflags & ATA_PFLAG_LOADING)
817                 ap->pflags &= ~ATA_PFLAG_LOADING;
818         else if (ap->pflags & ATA_PFLAG_SCSI_HOTPLUG)
819                 schedule_delayed_work(&ap->hotplug_task, 0);
820
821         if (ap->pflags & ATA_PFLAG_RECOVERED)
822                 ata_port_info(ap, "EH complete\n");
823
824         ap->pflags &= ~(ATA_PFLAG_SCSI_HOTPLUG | ATA_PFLAG_RECOVERED);
825
826         /* tell wait_eh that we're done */
827         ap->pflags &= ~ATA_PFLAG_EH_IN_PROGRESS;
828         wake_up_all(&ap->eh_wait_q);
829
830         spin_unlock_irqrestore(ap->lock, flags);
831 }
832 EXPORT_SYMBOL_GPL(ata_scsi_port_error_handler);
833
834 /**
835  *      ata_port_wait_eh - Wait for the currently pending EH to complete
836  *      @ap: Port to wait EH for
837  *
838  *      Wait until the currently pending EH is complete.
839  *
840  *      LOCKING:
841  *      Kernel thread context (may sleep).
842  */
843 void ata_port_wait_eh(struct ata_port *ap)
844 {
845         unsigned long flags;
846         DEFINE_WAIT(wait);
847
848  retry:
849         spin_lock_irqsave(ap->lock, flags);
850
851         while (ap->pflags & (ATA_PFLAG_EH_PENDING | ATA_PFLAG_EH_IN_PROGRESS)) {
852                 prepare_to_wait(&ap->eh_wait_q, &wait, TASK_UNINTERRUPTIBLE);
853                 spin_unlock_irqrestore(ap->lock, flags);
854                 schedule();
855                 spin_lock_irqsave(ap->lock, flags);
856         }
857         finish_wait(&ap->eh_wait_q, &wait);
858
859         spin_unlock_irqrestore(ap->lock, flags);
860
861         /* make sure SCSI EH is complete */
862         if (scsi_host_in_recovery(ap->scsi_host)) {
863                 ata_msleep(ap, 10);
864                 goto retry;
865         }
866 }
867 EXPORT_SYMBOL_GPL(ata_port_wait_eh);
868
869 static int ata_eh_nr_in_flight(struct ata_port *ap)
870 {
871         unsigned int tag;
872         int nr = 0;
873
874         /* count only non-internal commands */
875         for (tag = 0; tag < ATA_MAX_QUEUE - 1; tag++)
876                 if (ata_qc_from_tag(ap, tag))
877                         nr++;
878
879         return nr;
880 }
881
882 void ata_eh_fastdrain_timerfn(unsigned long arg)
883 {
884         struct ata_port *ap = (void *)arg;
885         unsigned long flags;
886         int cnt;
887
888         spin_lock_irqsave(ap->lock, flags);
889
890         cnt = ata_eh_nr_in_flight(ap);
891
892         /* are we done? */
893         if (!cnt)
894                 goto out_unlock;
895
896         if (cnt == ap->fastdrain_cnt) {
897                 unsigned int tag;
898
899                 /* No progress during the last interval, tag all
900                  * in-flight qcs as timed out and freeze the port.
901                  */
902                 for (tag = 0; tag < ATA_MAX_QUEUE - 1; tag++) {
903                         struct ata_queued_cmd *qc = ata_qc_from_tag(ap, tag);
904                         if (qc)
905                                 qc->err_mask |= AC_ERR_TIMEOUT;
906                 }
907
908                 ata_port_freeze(ap);
909         } else {
910                 /* some qcs have finished, give it another chance */
911                 ap->fastdrain_cnt = cnt;
912                 ap->fastdrain_timer.expires =
913                         ata_deadline(jiffies, ATA_EH_FASTDRAIN_INTERVAL);
914                 add_timer(&ap->fastdrain_timer);
915         }
916
917  out_unlock:
918         spin_unlock_irqrestore(ap->lock, flags);
919 }
920
921 /**
922  *      ata_eh_set_pending - set ATA_PFLAG_EH_PENDING and activate fast drain
923  *      @ap: target ATA port
924  *      @fastdrain: activate fast drain
925  *
926  *      Set ATA_PFLAG_EH_PENDING and activate fast drain if @fastdrain
927  *      is non-zero and EH wasn't pending before.  Fast drain ensures
928  *      that EH kicks in in timely manner.
929  *
930  *      LOCKING:
931  *      spin_lock_irqsave(host lock)
932  */
933 static void ata_eh_set_pending(struct ata_port *ap, int fastdrain)
934 {
935         int cnt;
936
937         /* already scheduled? */
938         if (ap->pflags & ATA_PFLAG_EH_PENDING)
939                 return;
940
941         ap->pflags |= ATA_PFLAG_EH_PENDING;
942
943         if (!fastdrain)
944                 return;
945
946         /* do we have in-flight qcs? */
947         cnt = ata_eh_nr_in_flight(ap);
948         if (!cnt)
949                 return;
950
951         /* activate fast drain */
952         ap->fastdrain_cnt = cnt;
953         ap->fastdrain_timer.expires =
954                 ata_deadline(jiffies, ATA_EH_FASTDRAIN_INTERVAL);
955         add_timer(&ap->fastdrain_timer);
956 }
957
958 /**
959  *      ata_qc_schedule_eh - schedule qc for error handling
960  *      @qc: command to schedule error handling for
961  *
962  *      Schedule error handling for @qc.  EH will kick in as soon as
963  *      other commands are drained.
964  *
965  *      LOCKING:
966  *      spin_lock_irqsave(host lock)
967  */
968 void ata_qc_schedule_eh(struct ata_queued_cmd *qc)
969 {
970         struct ata_port *ap = qc->ap;
971         struct request_queue *q = qc->scsicmd->device->request_queue;
972         unsigned long flags;
973
974         WARN_ON(!ap->ops->error_handler);
975
976         qc->flags |= ATA_QCFLAG_FAILED;
977         ata_eh_set_pending(ap, 1);
978
979         /* The following will fail if timeout has already expired.
980          * ata_scsi_error() takes care of such scmds on EH entry.
981          * Note that ATA_QCFLAG_FAILED is unconditionally set after
982          * this function completes.
983          */
984         spin_lock_irqsave(q->queue_lock, flags);
985         blk_abort_request(qc->scsicmd->request);
986         spin_unlock_irqrestore(q->queue_lock, flags);
987 }
988
989 /**
990  * ata_std_sched_eh - non-libsas ata_ports issue eh with this common routine
991  * @ap: ATA port to schedule EH for
992  *
993  *      LOCKING: inherited from ata_port_schedule_eh
994  *      spin_lock_irqsave(host lock)
995  */
996 void ata_std_sched_eh(struct ata_port *ap)
997 {
998         WARN_ON(!ap->ops->error_handler);
999
1000         if (ap->pflags & ATA_PFLAG_INITIALIZING)
1001                 return;
1002
1003         ata_eh_set_pending(ap, 1);
1004         scsi_schedule_eh(ap->scsi_host);
1005
1006         DPRINTK("port EH scheduled\n");
1007 }
1008 EXPORT_SYMBOL_GPL(ata_std_sched_eh);
1009
1010 /**
1011  * ata_std_end_eh - non-libsas ata_ports complete eh with this common routine
1012  * @ap: ATA port to end EH for
1013  *
1014  * In the libata object model there is a 1:1 mapping of ata_port to
1015  * shost, so host fields can be directly manipulated under ap->lock, in
1016  * the libsas case we need to hold a lock at the ha->level to coordinate
1017  * these events.
1018  *
1019  *      LOCKING:
1020  *      spin_lock_irqsave(host lock)
1021  */
1022 void ata_std_end_eh(struct ata_port *ap)
1023 {
1024         struct Scsi_Host *host = ap->scsi_host;
1025
1026         host->host_eh_scheduled = 0;
1027 }
1028 EXPORT_SYMBOL(ata_std_end_eh);
1029
1030
1031 /**
1032  *      ata_port_schedule_eh - schedule error handling without a qc
1033  *      @ap: ATA port to schedule EH for
1034  *
1035  *      Schedule error handling for @ap.  EH will kick in as soon as
1036  *      all commands are drained.
1037  *
1038  *      LOCKING:
1039  *      spin_lock_irqsave(host lock)
1040  */
1041 void ata_port_schedule_eh(struct ata_port *ap)
1042 {
1043         /* see: ata_std_sched_eh, unless you know better */
1044         ap->ops->sched_eh(ap);
1045 }
1046
1047 static int ata_do_link_abort(struct ata_port *ap, struct ata_link *link)
1048 {
1049         int tag, nr_aborted = 0;
1050
1051         WARN_ON(!ap->ops->error_handler);
1052
1053         /* we're gonna abort all commands, no need for fast drain */
1054         ata_eh_set_pending(ap, 0);
1055
1056         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
1057                 struct ata_queued_cmd *qc = ata_qc_from_tag(ap, tag);
1058
1059                 if (qc && (!link || qc->dev->link == link)) {
1060                         qc->flags |= ATA_QCFLAG_FAILED;
1061                         ata_qc_complete(qc);
1062                         nr_aborted++;
1063                 }
1064         }
1065
1066         if (!nr_aborted)
1067                 ata_port_schedule_eh(ap);
1068
1069         return nr_aborted;
1070 }
1071
1072 /**
1073  *      ata_link_abort - abort all qc's on the link
1074  *      @link: ATA link to abort qc's for
1075  *
1076  *      Abort all active qc's active on @link and schedule EH.
1077  *
1078  *      LOCKING:
1079  *      spin_lock_irqsave(host lock)
1080  *
1081  *      RETURNS:
1082  *      Number of aborted qc's.
1083  */
1084 int ata_link_abort(struct ata_link *link)
1085 {
1086         return ata_do_link_abort(link->ap, link);
1087 }
1088
1089 /**
1090  *      ata_port_abort - abort all qc's on the port
1091  *      @ap: ATA port to abort qc's for
1092  *
1093  *      Abort all active qc's of @ap and schedule EH.
1094  *
1095  *      LOCKING:
1096  *      spin_lock_irqsave(host_set lock)
1097  *
1098  *      RETURNS:
1099  *      Number of aborted qc's.
1100  */
1101 int ata_port_abort(struct ata_port *ap)
1102 {
1103         return ata_do_link_abort(ap, NULL);
1104 }
1105
1106 /**
1107  *      __ata_port_freeze - freeze port
1108  *      @ap: ATA port to freeze
1109  *
1110  *      This function is called when HSM violation or some other
1111  *      condition disrupts normal operation of the port.  Frozen port
1112  *      is not allowed to perform any operation until the port is
1113  *      thawed, which usually follows a successful reset.
1114  *
1115  *      ap->ops->freeze() callback can be used for freezing the port
1116  *      hardware-wise (e.g. mask interrupt and stop DMA engine).  If a
1117  *      port cannot be frozen hardware-wise, the interrupt handler
1118  *      must ack and clear interrupts unconditionally while the port
1119  *      is frozen.
1120  *
1121  *      LOCKING:
1122  *      spin_lock_irqsave(host lock)
1123  */
1124 static void __ata_port_freeze(struct ata_port *ap)
1125 {
1126         WARN_ON(!ap->ops->error_handler);
1127
1128         if (ap->ops->freeze)
1129                 ap->ops->freeze(ap);
1130
1131         ap->pflags |= ATA_PFLAG_FROZEN;
1132
1133         DPRINTK("ata%u port frozen\n", ap->print_id);
1134 }
1135
1136 /**
1137  *      ata_port_freeze - abort & freeze port
1138  *      @ap: ATA port to freeze
1139  *
1140  *      Abort and freeze @ap.  The freeze operation must be called
1141  *      first, because some hardware requires special operations
1142  *      before the taskfile registers are accessible.
1143  *
1144  *      LOCKING:
1145  *      spin_lock_irqsave(host lock)
1146  *
1147  *      RETURNS:
1148  *      Number of aborted commands.
1149  */
1150 int ata_port_freeze(struct ata_port *ap)
1151 {
1152         int nr_aborted;
1153
1154         WARN_ON(!ap->ops->error_handler);
1155
1156         __ata_port_freeze(ap);
1157         nr_aborted = ata_port_abort(ap);
1158
1159         return nr_aborted;
1160 }
1161
1162 /**
1163  *      sata_async_notification - SATA async notification handler
1164  *      @ap: ATA port where async notification is received
1165  *
1166  *      Handler to be called when async notification via SDB FIS is
1167  *      received.  This function schedules EH if necessary.
1168  *
1169  *      LOCKING:
1170  *      spin_lock_irqsave(host lock)
1171  *
1172  *      RETURNS:
1173  *      1 if EH is scheduled, 0 otherwise.
1174  */
1175 int sata_async_notification(struct ata_port *ap)
1176 {
1177         u32 sntf;
1178         int rc;
1179
1180         if (!(ap->flags & ATA_FLAG_AN))
1181                 return 0;
1182
1183         rc = sata_scr_read(&ap->link, SCR_NOTIFICATION, &sntf);
1184         if (rc == 0)
1185                 sata_scr_write(&ap->link, SCR_NOTIFICATION, sntf);
1186
1187         if (!sata_pmp_attached(ap) || rc) {
1188                 /* PMP is not attached or SNTF is not available */
1189                 if (!sata_pmp_attached(ap)) {
1190                         /* PMP is not attached.  Check whether ATAPI
1191                          * AN is configured.  If so, notify media
1192                          * change.
1193                          */
1194                         struct ata_device *dev = ap->link.device;
1195
1196                         if ((dev->class == ATA_DEV_ATAPI) &&
1197                             (dev->flags & ATA_DFLAG_AN))
1198                                 ata_scsi_media_change_notify(dev);
1199                         return 0;
1200                 } else {
1201                         /* PMP is attached but SNTF is not available.
1202                          * ATAPI async media change notification is
1203                          * not used.  The PMP must be reporting PHY
1204                          * status change, schedule EH.
1205                          */
1206                         ata_port_schedule_eh(ap);
1207                         return 1;
1208                 }
1209         } else {
1210                 /* PMP is attached and SNTF is available */
1211                 struct ata_link *link;
1212
1213                 /* check and notify ATAPI AN */
1214                 ata_for_each_link(link, ap, EDGE) {
1215                         if (!(sntf & (1 << link->pmp)))
1216                                 continue;
1217
1218                         if ((link->device->class == ATA_DEV_ATAPI) &&
1219                             (link->device->flags & ATA_DFLAG_AN))
1220                                 ata_scsi_media_change_notify(link->device);
1221                 }
1222
1223                 /* If PMP is reporting that PHY status of some
1224                  * downstream ports has changed, schedule EH.
1225                  */
1226                 if (sntf & (1 << SATA_PMP_CTRL_PORT)) {
1227                         ata_port_schedule_eh(ap);
1228                         return 1;
1229                 }
1230
1231                 return 0;
1232         }
1233 }
1234
1235 /**
1236  *      ata_eh_freeze_port - EH helper to freeze port
1237  *      @ap: ATA port to freeze
1238  *
1239  *      Freeze @ap.
1240  *
1241  *      LOCKING:
1242  *      None.
1243  */
1244 void ata_eh_freeze_port(struct ata_port *ap)
1245 {
1246         unsigned long flags;
1247
1248         if (!ap->ops->error_handler)
1249                 return;
1250
1251         spin_lock_irqsave(ap->lock, flags);
1252         __ata_port_freeze(ap);
1253         spin_unlock_irqrestore(ap->lock, flags);
1254 }
1255
1256 /**
1257  *      ata_port_thaw_port - EH helper to thaw port
1258  *      @ap: ATA port to thaw
1259  *
1260  *      Thaw frozen port @ap.
1261  *
1262  *      LOCKING:
1263  *      None.
1264  */
1265 void ata_eh_thaw_port(struct ata_port *ap)
1266 {
1267         unsigned long flags;
1268
1269         if (!ap->ops->error_handler)
1270                 return;
1271
1272         spin_lock_irqsave(ap->lock, flags);
1273
1274         ap->pflags &= ~ATA_PFLAG_FROZEN;
1275
1276         if (ap->ops->thaw)
1277                 ap->ops->thaw(ap);
1278
1279         spin_unlock_irqrestore(ap->lock, flags);
1280
1281         DPRINTK("ata%u port thawed\n", ap->print_id);
1282 }
1283
1284 static void ata_eh_scsidone(struct scsi_cmnd *scmd)
1285 {
1286         /* nada */
1287 }
1288
1289 static void __ata_eh_qc_complete(struct ata_queued_cmd *qc)
1290 {
1291         struct ata_port *ap = qc->ap;
1292         struct scsi_cmnd *scmd = qc->scsicmd;
1293         unsigned long flags;
1294
1295         spin_lock_irqsave(ap->lock, flags);
1296         qc->scsidone = ata_eh_scsidone;
1297         __ata_qc_complete(qc);
1298         WARN_ON(ata_tag_valid(qc->tag));
1299         spin_unlock_irqrestore(ap->lock, flags);
1300
1301         scsi_eh_finish_cmd(scmd, &ap->eh_done_q);
1302 }
1303
1304 /**
1305  *      ata_eh_qc_complete - Complete an active ATA command from EH
1306  *      @qc: Command to complete
1307  *
1308  *      Indicate to the mid and upper layers that an ATA command has
1309  *      completed.  To be used from EH.
1310  */
1311 void ata_eh_qc_complete(struct ata_queued_cmd *qc)
1312 {
1313         struct scsi_cmnd *scmd = qc->scsicmd;
1314         scmd->retries = scmd->allowed;
1315         __ata_eh_qc_complete(qc);
1316 }
1317
1318 /**
1319  *      ata_eh_qc_retry - Tell midlayer to retry an ATA command after EH
1320  *      @qc: Command to retry
1321  *
1322  *      Indicate to the mid and upper layers that an ATA command
1323  *      should be retried.  To be used from EH.
1324  *
1325  *      SCSI midlayer limits the number of retries to scmd->allowed.
1326  *      scmd->allowed is incremented for commands which get retried
1327  *      due to unrelated failures (qc->err_mask is zero).
1328  */
1329 void ata_eh_qc_retry(struct ata_queued_cmd *qc)
1330 {
1331         struct scsi_cmnd *scmd = qc->scsicmd;
1332         if (!qc->err_mask)
1333                 scmd->allowed++;
1334         __ata_eh_qc_complete(qc);
1335 }
1336
1337 /**
1338  *      ata_dev_disable - disable ATA device
1339  *      @dev: ATA device to disable
1340  *
1341  *      Disable @dev.
1342  *
1343  *      Locking:
1344  *      EH context.
1345  */
1346 void ata_dev_disable(struct ata_device *dev)
1347 {
1348         if (!ata_dev_enabled(dev))
1349                 return;
1350
1351         if (ata_msg_drv(dev->link->ap))
1352                 ata_dev_warn(dev, "disabled\n");
1353         ata_acpi_on_disable(dev);
1354         ata_down_xfermask_limit(dev, ATA_DNXFER_FORCE_PIO0 | ATA_DNXFER_QUIET);
1355         dev->class++;
1356
1357         /* From now till the next successful probe, ering is used to
1358          * track probe failures.  Clear accumulated device error info.
1359          */
1360         ata_ering_clear(&dev->ering);
1361 }
1362
1363 /**
1364  *      ata_eh_detach_dev - detach ATA device
1365  *      @dev: ATA device to detach
1366  *
1367  *      Detach @dev.
1368  *
1369  *      LOCKING:
1370  *      None.
1371  */
1372 void ata_eh_detach_dev(struct ata_device *dev)
1373 {
1374         struct ata_link *link = dev->link;
1375         struct ata_port *ap = link->ap;
1376         struct ata_eh_context *ehc = &link->eh_context;
1377         unsigned long flags;
1378
1379         ata_dev_disable(dev);
1380
1381         spin_lock_irqsave(ap->lock, flags);
1382
1383         dev->flags &= ~ATA_DFLAG_DETACH;
1384
1385         if (ata_scsi_offline_dev(dev)) {
1386                 dev->flags |= ATA_DFLAG_DETACHED;
1387                 ap->pflags |= ATA_PFLAG_SCSI_HOTPLUG;
1388         }
1389
1390         /* clear per-dev EH info */
1391         ata_eh_clear_action(link, dev, &link->eh_info, ATA_EH_PERDEV_MASK);
1392         ata_eh_clear_action(link, dev, &link->eh_context.i, ATA_EH_PERDEV_MASK);
1393         ehc->saved_xfer_mode[dev->devno] = 0;
1394         ehc->saved_ncq_enabled &= ~(1 << dev->devno);
1395
1396         spin_unlock_irqrestore(ap->lock, flags);
1397 }
1398
1399 /**
1400  *      ata_eh_about_to_do - about to perform eh_action
1401  *      @link: target ATA link
1402  *      @dev: target ATA dev for per-dev action (can be NULL)
1403  *      @action: action about to be performed
1404  *
1405  *      Called just before performing EH actions to clear related bits
1406  *      in @link->eh_info such that eh actions are not unnecessarily
1407  *      repeated.
1408  *
1409  *      LOCKING:
1410  *      None.
1411  */
1412 void ata_eh_about_to_do(struct ata_link *link, struct ata_device *dev,
1413                         unsigned int action)
1414 {
1415         struct ata_port *ap = link->ap;
1416         struct ata_eh_info *ehi = &link->eh_info;
1417         struct ata_eh_context *ehc = &link->eh_context;
1418         unsigned long flags;
1419
1420         spin_lock_irqsave(ap->lock, flags);
1421
1422         ata_eh_clear_action(link, dev, ehi, action);
1423
1424         /* About to take EH action, set RECOVERED.  Ignore actions on
1425          * slave links as master will do them again.
1426          */
1427         if (!(ehc->i.flags & ATA_EHI_QUIET) && link != ap->slave_link)
1428                 ap->pflags |= ATA_PFLAG_RECOVERED;
1429
1430         spin_unlock_irqrestore(ap->lock, flags);
1431 }
1432
1433 /**
1434  *      ata_eh_done - EH action complete
1435 *       @ap: target ATA port
1436  *      @dev: target ATA dev for per-dev action (can be NULL)
1437  *      @action: action just completed
1438  *
1439  *      Called right after performing EH actions to clear related bits
1440  *      in @link->eh_context.
1441  *
1442  *      LOCKING:
1443  *      None.
1444  */
1445 void ata_eh_done(struct ata_link *link, struct ata_device *dev,
1446                  unsigned int action)
1447 {
1448         struct ata_eh_context *ehc = &link->eh_context;
1449
1450         ata_eh_clear_action(link, dev, &ehc->i, action);
1451 }
1452
1453 /**
1454  *      ata_err_string - convert err_mask to descriptive string
1455  *      @err_mask: error mask to convert to string
1456  *
1457  *      Convert @err_mask to descriptive string.  Errors are
1458  *      prioritized according to severity and only the most severe
1459  *      error is reported.
1460  *
1461  *      LOCKING:
1462  *      None.
1463  *
1464  *      RETURNS:
1465  *      Descriptive string for @err_mask
1466  */
1467 static const char *ata_err_string(unsigned int err_mask)
1468 {
1469         if (err_mask & AC_ERR_HOST_BUS)
1470                 return "host bus error";
1471         if (err_mask & AC_ERR_ATA_BUS)
1472                 return "ATA bus error";
1473         if (err_mask & AC_ERR_TIMEOUT)
1474                 return "timeout";
1475         if (err_mask & AC_ERR_HSM)
1476                 return "HSM violation";
1477         if (err_mask & AC_ERR_SYSTEM)
1478                 return "internal error";
1479         if (err_mask & AC_ERR_MEDIA)
1480                 return "media error";
1481         if (err_mask & AC_ERR_INVALID)
1482                 return "invalid argument";
1483         if (err_mask & AC_ERR_DEV)
1484                 return "device error";
1485         return "unknown error";
1486 }
1487
1488 /**
1489  *      ata_read_log_page - read a specific log page
1490  *      @dev: target device
1491  *      @log: log to read
1492  *      @page: page to read
1493  *      @buf: buffer to store read page
1494  *      @sectors: number of sectors to read
1495  *
1496  *      Read log page using READ_LOG_EXT command.
1497  *
1498  *      LOCKING:
1499  *      Kernel thread context (may sleep).
1500  *
1501  *      RETURNS:
1502  *      0 on success, AC_ERR_* mask otherwise.
1503  */
1504 unsigned int ata_read_log_page(struct ata_device *dev, u8 log,
1505                                u8 page, void *buf, unsigned int sectors)
1506 {
1507         struct ata_taskfile tf;
1508         unsigned int err_mask;
1509
1510         DPRINTK("read log page - log 0x%x, page 0x%x\n", log, page);
1511
1512         ata_tf_init(dev, &tf);
1513         tf.command = ATA_CMD_READ_LOG_EXT;
1514         tf.lbal = log;
1515         tf.lbam = page;
1516         tf.nsect = sectors;
1517         tf.hob_nsect = sectors >> 8;
1518         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_LBA48 | ATA_TFLAG_DEVICE;
1519         tf.protocol = ATA_PROT_PIO;
1520
1521         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_FROM_DEVICE,
1522                                      buf, sectors * ATA_SECT_SIZE, 0);
1523
1524         DPRINTK("EXIT, err_mask=%x\n", err_mask);
1525         return err_mask;
1526 }
1527
1528 /**
1529  *      ata_eh_read_log_10h - Read log page 10h for NCQ error details
1530  *      @dev: Device to read log page 10h from
1531  *      @tag: Resulting tag of the failed command
1532  *      @tf: Resulting taskfile registers of the failed command
1533  *
1534  *      Read log page 10h to obtain NCQ error details and clear error
1535  *      condition.
1536  *
1537  *      LOCKING:
1538  *      Kernel thread context (may sleep).
1539  *
1540  *      RETURNS:
1541  *      0 on success, -errno otherwise.
1542  */
1543 static int ata_eh_read_log_10h(struct ata_device *dev,
1544                                int *tag, struct ata_taskfile *tf)
1545 {
1546         u8 *buf = dev->link->ap->sector_buf;
1547         unsigned int err_mask;
1548         u8 csum;
1549         int i;
1550
1551         err_mask = ata_read_log_page(dev, ATA_LOG_SATA_NCQ, 0, buf, 1);
1552         if (err_mask)
1553                 return -EIO;
1554
1555         csum = 0;
1556         for (i = 0; i < ATA_SECT_SIZE; i++)
1557                 csum += buf[i];
1558         if (csum)
1559                 ata_dev_warn(dev, "invalid checksum 0x%x on log page 10h\n",
1560                              csum);
1561
1562         if (buf[0] & 0x80)
1563                 return -ENOENT;
1564
1565         *tag = buf[0] & 0x1f;
1566
1567         tf->command = buf[2];
1568         tf->feature = buf[3];
1569         tf->lbal = buf[4];
1570         tf->lbam = buf[5];
1571         tf->lbah = buf[6];
1572         tf->device = buf[7];
1573         tf->hob_lbal = buf[8];
1574         tf->hob_lbam = buf[9];
1575         tf->hob_lbah = buf[10];
1576         tf->nsect = buf[12];
1577         tf->hob_nsect = buf[13];
1578
1579         return 0;
1580 }
1581
1582 /**
1583  *      atapi_eh_tur - perform ATAPI TEST_UNIT_READY
1584  *      @dev: target ATAPI device
1585  *      @r_sense_key: out parameter for sense_key
1586  *
1587  *      Perform ATAPI TEST_UNIT_READY.
1588  *
1589  *      LOCKING:
1590  *      EH context (may sleep).
1591  *
1592  *      RETURNS:
1593  *      0 on success, AC_ERR_* mask on failure.
1594  */
1595 unsigned int atapi_eh_tur(struct ata_device *dev, u8 *r_sense_key)
1596 {
1597         u8 cdb[ATAPI_CDB_LEN] = { TEST_UNIT_READY, 0, 0, 0, 0, 0 };
1598         struct ata_taskfile tf;
1599         unsigned int err_mask;
1600
1601         ata_tf_init(dev, &tf);
1602
1603         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_DEVICE;
1604         tf.command = ATA_CMD_PACKET;
1605         tf.protocol = ATAPI_PROT_NODATA;
1606
1607         err_mask = ata_exec_internal(dev, &tf, cdb, DMA_NONE, NULL, 0, 0);
1608         if (err_mask == AC_ERR_DEV)
1609                 *r_sense_key = tf.feature >> 4;
1610         return err_mask;
1611 }
1612
1613 /**
1614  *      atapi_eh_request_sense - perform ATAPI REQUEST_SENSE
1615  *      @dev: device to perform REQUEST_SENSE to
1616  *      @sense_buf: result sense data buffer (SCSI_SENSE_BUFFERSIZE bytes long)
1617  *      @dfl_sense_key: default sense key to use
1618  *
1619  *      Perform ATAPI REQUEST_SENSE after the device reported CHECK
1620  *      SENSE.  This function is EH helper.
1621  *
1622  *      LOCKING:
1623  *      Kernel thread context (may sleep).
1624  *
1625  *      RETURNS:
1626  *      0 on success, AC_ERR_* mask on failure
1627  */
1628 unsigned int atapi_eh_request_sense(struct ata_device *dev,
1629                                            u8 *sense_buf, u8 dfl_sense_key)
1630 {
1631         u8 cdb[ATAPI_CDB_LEN] =
1632                 { REQUEST_SENSE, 0, 0, 0, SCSI_SENSE_BUFFERSIZE, 0 };
1633         struct ata_port *ap = dev->link->ap;
1634         struct ata_taskfile tf;
1635
1636         DPRINTK("ATAPI request sense\n");
1637
1638         /* FIXME: is this needed? */
1639         memset(sense_buf, 0, SCSI_SENSE_BUFFERSIZE);
1640
1641         /* initialize sense_buf with the error register,
1642          * for the case where they are -not- overwritten
1643          */
1644         sense_buf[0] = 0x70;
1645         sense_buf[2] = dfl_sense_key;
1646
1647         /* some devices time out if garbage left in tf */
1648         ata_tf_init(dev, &tf);
1649
1650         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_DEVICE;
1651         tf.command = ATA_CMD_PACKET;
1652
1653         /* is it pointless to prefer PIO for "safety reasons"? */
1654         if (ap->flags & ATA_FLAG_PIO_DMA) {
1655                 tf.protocol = ATAPI_PROT_DMA;
1656                 tf.feature |= ATAPI_PKT_DMA;
1657         } else {
1658                 tf.protocol = ATAPI_PROT_PIO;
1659                 tf.lbam = SCSI_SENSE_BUFFERSIZE;
1660                 tf.lbah = 0;
1661         }
1662
1663         return ata_exec_internal(dev, &tf, cdb, DMA_FROM_DEVICE,
1664                                  sense_buf, SCSI_SENSE_BUFFERSIZE, 0);
1665 }
1666
1667 /**
1668  *      ata_eh_analyze_serror - analyze SError for a failed port
1669  *      @link: ATA link to analyze SError for
1670  *
1671  *      Analyze SError if available and further determine cause of
1672  *      failure.
1673  *
1674  *      LOCKING:
1675  *      None.
1676  */
1677 static void ata_eh_analyze_serror(struct ata_link *link)
1678 {
1679         struct ata_eh_context *ehc = &link->eh_context;
1680         u32 serror = ehc->i.serror;
1681         unsigned int err_mask = 0, action = 0;
1682         u32 hotplug_mask;
1683
1684         if (serror & (SERR_PERSISTENT | SERR_DATA)) {
1685                 err_mask |= AC_ERR_ATA_BUS;
1686                 action |= ATA_EH_RESET;
1687         }
1688         if (serror & SERR_PROTOCOL) {
1689                 err_mask |= AC_ERR_HSM;
1690                 action |= ATA_EH_RESET;
1691         }
1692         if (serror & SERR_INTERNAL) {
1693                 err_mask |= AC_ERR_SYSTEM;
1694                 action |= ATA_EH_RESET;
1695         }
1696
1697         /* Determine whether a hotplug event has occurred.  Both
1698          * SError.N/X are considered hotplug events for enabled or
1699          * host links.  For disabled PMP links, only N bit is
1700          * considered as X bit is left at 1 for link plugging.
1701          */
1702         if (link->lpm_policy > ATA_LPM_MAX_POWER)
1703                 hotplug_mask = 0;       /* hotplug doesn't work w/ LPM */
1704         else if (!(link->flags & ATA_LFLAG_DISABLED) || ata_is_host_link(link))
1705                 hotplug_mask = SERR_PHYRDY_CHG | SERR_DEV_XCHG;
1706         else
1707                 hotplug_mask = SERR_PHYRDY_CHG;
1708
1709         if (serror & hotplug_mask)
1710                 ata_ehi_hotplugged(&ehc->i);
1711
1712         ehc->i.err_mask |= err_mask;
1713         ehc->i.action |= action;
1714 }
1715
1716 /**
1717  *      ata_eh_analyze_ncq_error - analyze NCQ error
1718  *      @link: ATA link to analyze NCQ error for
1719  *
1720  *      Read log page 10h, determine the offending qc and acquire
1721  *      error status TF.  For NCQ device errors, all LLDDs have to do
1722  *      is setting AC_ERR_DEV in ehi->err_mask.  This function takes
1723  *      care of the rest.
1724  *
1725  *      LOCKING:
1726  *      Kernel thread context (may sleep).
1727  */
1728 void ata_eh_analyze_ncq_error(struct ata_link *link)
1729 {
1730         struct ata_port *ap = link->ap;
1731         struct ata_eh_context *ehc = &link->eh_context;
1732         struct ata_device *dev = link->device;
1733         struct ata_queued_cmd *qc;
1734         struct ata_taskfile tf;
1735         int tag, rc;
1736
1737         /* if frozen, we can't do much */
1738         if (ap->pflags & ATA_PFLAG_FROZEN)
1739                 return;
1740
1741         /* is it NCQ device error? */
1742         if (!link->sactive || !(ehc->i.err_mask & AC_ERR_DEV))
1743                 return;
1744
1745         /* has LLDD analyzed already? */
1746         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
1747                 qc = __ata_qc_from_tag(ap, tag);
1748
1749                 if (!(qc->flags & ATA_QCFLAG_FAILED))
1750                         continue;
1751
1752                 if (qc->err_mask)
1753                         return;
1754         }
1755
1756         /* okay, this error is ours */
1757         memset(&tf, 0, sizeof(tf));
1758         rc = ata_eh_read_log_10h(dev, &tag, &tf);
1759         if (rc) {
1760                 ata_link_err(link, "failed to read log page 10h (errno=%d)\n",
1761                              rc);
1762                 return;
1763         }
1764
1765         if (!(link->sactive & (1 << tag))) {
1766                 ata_link_err(link, "log page 10h reported inactive tag %d\n",
1767                              tag);
1768                 return;
1769         }
1770
1771         /* we've got the perpetrator, condemn it */
1772         qc = __ata_qc_from_tag(ap, tag);
1773         memcpy(&qc->result_tf, &tf, sizeof(tf));
1774         qc->result_tf.flags = ATA_TFLAG_ISADDR | ATA_TFLAG_LBA | ATA_TFLAG_LBA48;
1775         qc->err_mask |= AC_ERR_DEV | AC_ERR_NCQ;
1776         ehc->i.err_mask &= ~AC_ERR_DEV;
1777 }
1778
1779 /**
1780  *      ata_eh_analyze_tf - analyze taskfile of a failed qc
1781  *      @qc: qc to analyze
1782  *      @tf: Taskfile registers to analyze
1783  *
1784  *      Analyze taskfile of @qc and further determine cause of
1785  *      failure.  This function also requests ATAPI sense data if
1786  *      available.
1787  *
1788  *      LOCKING:
1789  *      Kernel thread context (may sleep).
1790  *
1791  *      RETURNS:
1792  *      Determined recovery action
1793  */
1794 static unsigned int ata_eh_analyze_tf(struct ata_queued_cmd *qc,
1795                                       const struct ata_taskfile *tf)
1796 {
1797         unsigned int tmp, action = 0;
1798         u8 stat = tf->command, err = tf->feature;
1799
1800         if ((stat & (ATA_BUSY | ATA_DRQ | ATA_DRDY)) != ATA_DRDY) {
1801                 qc->err_mask |= AC_ERR_HSM;
1802                 return ATA_EH_RESET;
1803         }
1804
1805         if (stat & (ATA_ERR | ATA_DF))
1806                 qc->err_mask |= AC_ERR_DEV;
1807         else
1808                 return 0;
1809
1810         switch (qc->dev->class) {
1811         case ATA_DEV_ATA:
1812         case ATA_DEV_ZAC:
1813                 if (err & ATA_ICRC)
1814                         qc->err_mask |= AC_ERR_ATA_BUS;
1815                 if (err & (ATA_UNC | ATA_AMNF))
1816                         qc->err_mask |= AC_ERR_MEDIA;
1817                 if (err & ATA_IDNF)
1818                         qc->err_mask |= AC_ERR_INVALID;
1819                 break;
1820
1821         case ATA_DEV_ATAPI:
1822                 if (!(qc->ap->pflags & ATA_PFLAG_FROZEN)) {
1823                         tmp = atapi_eh_request_sense(qc->dev,
1824                                                 qc->scsicmd->sense_buffer,
1825                                                 qc->result_tf.feature >> 4);
1826                         if (!tmp) {
1827                                 /* ATA_QCFLAG_SENSE_VALID is used to
1828                                  * tell atapi_qc_complete() that sense
1829                                  * data is already valid.
1830                                  *
1831                                  * TODO: interpret sense data and set
1832                                  * appropriate err_mask.
1833                                  */
1834                                 qc->flags |= ATA_QCFLAG_SENSE_VALID;
1835                         } else
1836                                 qc->err_mask |= tmp;
1837                 }
1838         }
1839
1840         if (qc->err_mask & (AC_ERR_HSM | AC_ERR_TIMEOUT | AC_ERR_ATA_BUS))
1841                 action |= ATA_EH_RESET;
1842
1843         return action;
1844 }
1845
1846 static int ata_eh_categorize_error(unsigned int eflags, unsigned int err_mask,
1847                                    int *xfer_ok)
1848 {
1849         int base = 0;
1850
1851         if (!(eflags & ATA_EFLAG_DUBIOUS_XFER))
1852                 *xfer_ok = 1;
1853
1854         if (!*xfer_ok)
1855                 base = ATA_ECAT_DUBIOUS_NONE;
1856
1857         if (err_mask & AC_ERR_ATA_BUS)
1858                 return base + ATA_ECAT_ATA_BUS;
1859
1860         if (err_mask & AC_ERR_TIMEOUT)
1861                 return base + ATA_ECAT_TOUT_HSM;
1862
1863         if (eflags & ATA_EFLAG_IS_IO) {
1864                 if (err_mask & AC_ERR_HSM)
1865                         return base + ATA_ECAT_TOUT_HSM;
1866                 if ((err_mask &
1867                      (AC_ERR_DEV|AC_ERR_MEDIA|AC_ERR_INVALID)) == AC_ERR_DEV)
1868                         return base + ATA_ECAT_UNK_DEV;
1869         }
1870
1871         return 0;
1872 }
1873
1874 struct speed_down_verdict_arg {
1875         u64 since;
1876         int xfer_ok;
1877         int nr_errors[ATA_ECAT_NR];
1878 };
1879
1880 static int speed_down_verdict_cb(struct ata_ering_entry *ent, void *void_arg)
1881 {
1882         struct speed_down_verdict_arg *arg = void_arg;
1883         int cat;
1884
1885         if ((ent->eflags & ATA_EFLAG_OLD_ER) || (ent->timestamp < arg->since))
1886                 return -1;
1887
1888         cat = ata_eh_categorize_error(ent->eflags, ent->err_mask,
1889                                       &arg->xfer_ok);
1890         arg->nr_errors[cat]++;
1891
1892         return 0;
1893 }
1894
1895 /**
1896  *      ata_eh_speed_down_verdict - Determine speed down verdict
1897  *      @dev: Device of interest
1898  *
1899  *      This function examines error ring of @dev and determines
1900  *      whether NCQ needs to be turned off, transfer speed should be
1901  *      stepped down, or falling back to PIO is necessary.
1902  *
1903  *      ECAT_ATA_BUS    : ATA_BUS error for any command
1904  *
1905  *      ECAT_TOUT_HSM   : TIMEOUT for any command or HSM violation for
1906  *                        IO commands
1907  *
1908  *      ECAT_UNK_DEV    : Unknown DEV error for IO commands
1909  *
1910  *      ECAT_DUBIOUS_*  : Identical to above three but occurred while
1911  *                        data transfer hasn't been verified.
1912  *
1913  *      Verdicts are
1914  *
1915  *      NCQ_OFF         : Turn off NCQ.
1916  *
1917  *      SPEED_DOWN      : Speed down transfer speed but don't fall back
1918  *                        to PIO.
1919  *
1920  *      FALLBACK_TO_PIO : Fall back to PIO.
1921  *
1922  *      Even if multiple verdicts are returned, only one action is
1923  *      taken per error.  An action triggered by non-DUBIOUS errors
1924  *      clears ering, while one triggered by DUBIOUS_* errors doesn't.
1925  *      This is to expedite speed down decisions right after device is
1926  *      initially configured.
1927  *
1928  *      The followings are speed down rules.  #1 and #2 deal with
1929  *      DUBIOUS errors.
1930  *
1931  *      1. If more than one DUBIOUS_ATA_BUS or DUBIOUS_TOUT_HSM errors
1932  *         occurred during last 5 mins, SPEED_DOWN and FALLBACK_TO_PIO.
1933  *
1934  *      2. If more than one DUBIOUS_TOUT_HSM or DUBIOUS_UNK_DEV errors
1935  *         occurred during last 5 mins, NCQ_OFF.
1936  *
1937  *      3. If more than 8 ATA_BUS, TOUT_HSM or UNK_DEV errors
1938  *         occurred during last 5 mins, FALLBACK_TO_PIO
1939  *
1940  *      4. If more than 3 TOUT_HSM or UNK_DEV errors occurred
1941  *         during last 10 mins, NCQ_OFF.
1942  *
1943  *      5. If more than 3 ATA_BUS or TOUT_HSM errors, or more than 6
1944  *         UNK_DEV errors occurred during last 10 mins, SPEED_DOWN.
1945  *
1946  *      LOCKING:
1947  *      Inherited from caller.
1948  *
1949  *      RETURNS:
1950  *      OR of ATA_EH_SPDN_* flags.
1951  */
1952 static unsigned int ata_eh_speed_down_verdict(struct ata_device *dev)
1953 {
1954         const u64 j5mins = 5LLU * 60 * HZ, j10mins = 10LLU * 60 * HZ;
1955         u64 j64 = get_jiffies_64();
1956         struct speed_down_verdict_arg arg;
1957         unsigned int verdict = 0;
1958
1959         /* scan past 5 mins of error history */
1960         memset(&arg, 0, sizeof(arg));
1961         arg.since = j64 - min(j64, j5mins);
1962         ata_ering_map(&dev->ering, speed_down_verdict_cb, &arg);
1963
1964         if (arg.nr_errors[ATA_ECAT_DUBIOUS_ATA_BUS] +
1965             arg.nr_errors[ATA_ECAT_DUBIOUS_TOUT_HSM] > 1)
1966                 verdict |= ATA_EH_SPDN_SPEED_DOWN |
1967                         ATA_EH_SPDN_FALLBACK_TO_PIO | ATA_EH_SPDN_KEEP_ERRORS;
1968
1969         if (arg.nr_errors[ATA_ECAT_DUBIOUS_TOUT_HSM] +
1970             arg.nr_errors[ATA_ECAT_DUBIOUS_UNK_DEV] > 1)
1971                 verdict |= ATA_EH_SPDN_NCQ_OFF | ATA_EH_SPDN_KEEP_ERRORS;
1972
1973         if (arg.nr_errors[ATA_ECAT_ATA_BUS] +
1974             arg.nr_errors[ATA_ECAT_TOUT_HSM] +
1975             arg.nr_errors[ATA_ECAT_UNK_DEV] > 6)
1976                 verdict |= ATA_EH_SPDN_FALLBACK_TO_PIO;
1977
1978         /* scan past 10 mins of error history */
1979         memset(&arg, 0, sizeof(arg));
1980         arg.since = j64 - min(j64, j10mins);
1981         ata_ering_map(&dev->ering, speed_down_verdict_cb, &arg);
1982
1983         if (arg.nr_errors[ATA_ECAT_TOUT_HSM] +
1984             arg.nr_errors[ATA_ECAT_UNK_DEV] > 3)
1985                 verdict |= ATA_EH_SPDN_NCQ_OFF;
1986
1987         if (arg.nr_errors[ATA_ECAT_ATA_BUS] +
1988             arg.nr_errors[ATA_ECAT_TOUT_HSM] > 3 ||
1989             arg.nr_errors[ATA_ECAT_UNK_DEV] > 6)
1990                 verdict |= ATA_EH_SPDN_SPEED_DOWN;
1991
1992         return verdict;
1993 }
1994
1995 /**
1996  *      ata_eh_speed_down - record error and speed down if necessary
1997  *      @dev: Failed device
1998  *      @eflags: mask of ATA_EFLAG_* flags
1999  *      @err_mask: err_mask of the error
2000  *
2001  *      Record error and examine error history to determine whether
2002  *      adjusting transmission speed is necessary.  It also sets
2003  *      transmission limits appropriately if such adjustment is
2004  *      necessary.
2005  *
2006  *      LOCKING:
2007  *      Kernel thread context (may sleep).
2008  *
2009  *      RETURNS:
2010  *      Determined recovery action.
2011  */
2012 static unsigned int ata_eh_speed_down(struct ata_device *dev,
2013                                 unsigned int eflags, unsigned int err_mask)
2014 {
2015         struct ata_link *link = ata_dev_phys_link(dev);
2016         int xfer_ok = 0;
2017         unsigned int verdict;
2018         unsigned int action = 0;
2019
2020         /* don't bother if Cat-0 error */
2021         if (ata_eh_categorize_error(eflags, err_mask, &xfer_ok) == 0)
2022                 return 0;
2023
2024         /* record error and determine whether speed down is necessary */
2025         ata_ering_record(&dev->ering, eflags, err_mask);
2026         verdict = ata_eh_speed_down_verdict(dev);
2027
2028         /* turn off NCQ? */
2029         if ((verdict & ATA_EH_SPDN_NCQ_OFF) &&
2030             (dev->flags & (ATA_DFLAG_PIO | ATA_DFLAG_NCQ |
2031                            ATA_DFLAG_NCQ_OFF)) == ATA_DFLAG_NCQ) {
2032                 dev->flags |= ATA_DFLAG_NCQ_OFF;
2033                 ata_dev_warn(dev, "NCQ disabled due to excessive errors\n");
2034                 goto done;
2035         }
2036
2037         /* speed down? */
2038         if (verdict & ATA_EH_SPDN_SPEED_DOWN) {
2039                 /* speed down SATA link speed if possible */
2040                 if (sata_down_spd_limit(link, 0) == 0) {
2041                         action |= ATA_EH_RESET;
2042                         goto done;
2043                 }
2044
2045                 /* lower transfer mode */
2046                 if (dev->spdn_cnt < 2) {
2047                         static const int dma_dnxfer_sel[] =
2048                                 { ATA_DNXFER_DMA, ATA_DNXFER_40C };
2049                         static const int pio_dnxfer_sel[] =
2050                                 { ATA_DNXFER_PIO, ATA_DNXFER_FORCE_PIO0 };
2051                         int sel;
2052
2053                         if (dev->xfer_shift != ATA_SHIFT_PIO)
2054                                 sel = dma_dnxfer_sel[dev->spdn_cnt];
2055                         else
2056                                 sel = pio_dnxfer_sel[dev->spdn_cnt];
2057
2058                         dev->spdn_cnt++;
2059
2060                         if (ata_down_xfermask_limit(dev, sel) == 0) {
2061                                 action |= ATA_EH_RESET;
2062                                 goto done;
2063                         }
2064                 }
2065         }
2066
2067         /* Fall back to PIO?  Slowing down to PIO is meaningless for
2068          * SATA ATA devices.  Consider it only for PATA and SATAPI.
2069          */
2070         if ((verdict & ATA_EH_SPDN_FALLBACK_TO_PIO) && (dev->spdn_cnt >= 2) &&
2071             (link->ap->cbl != ATA_CBL_SATA || dev->class == ATA_DEV_ATAPI) &&
2072             (dev->xfer_shift != ATA_SHIFT_PIO)) {
2073                 if (ata_down_xfermask_limit(dev, ATA_DNXFER_FORCE_PIO) == 0) {
2074                         dev->spdn_cnt = 0;
2075                         action |= ATA_EH_RESET;
2076                         goto done;
2077                 }
2078         }
2079
2080         return 0;
2081  done:
2082         /* device has been slowed down, blow error history */
2083         if (!(verdict & ATA_EH_SPDN_KEEP_ERRORS))
2084                 ata_ering_clear(&dev->ering);
2085         return action;
2086 }
2087
2088 /**
2089  *      ata_eh_worth_retry - analyze error and decide whether to retry
2090  *      @qc: qc to possibly retry
2091  *
2092  *      Look at the cause of the error and decide if a retry
2093  *      might be useful or not.  We don't want to retry media errors
2094  *      because the drive itself has probably already taken 10-30 seconds
2095  *      doing its own internal retries before reporting the failure.
2096  */
2097 static inline int ata_eh_worth_retry(struct ata_queued_cmd *qc)
2098 {
2099         if (qc->err_mask & AC_ERR_MEDIA)
2100                 return 0;       /* don't retry media errors */
2101         if (qc->flags & ATA_QCFLAG_IO)
2102                 return 1;       /* otherwise retry anything from fs stack */
2103         if (qc->err_mask & AC_ERR_INVALID)
2104                 return 0;       /* don't retry these */
2105         return qc->err_mask != AC_ERR_DEV;  /* retry if not dev error */
2106 }
2107
2108 /**
2109  *      ata_eh_link_autopsy - analyze error and determine recovery action
2110  *      @link: host link to perform autopsy on
2111  *
2112  *      Analyze why @link failed and determine which recovery actions
2113  *      are needed.  This function also sets more detailed AC_ERR_*
2114  *      values and fills sense data for ATAPI CHECK SENSE.
2115  *
2116  *      LOCKING:
2117  *      Kernel thread context (may sleep).
2118  */
2119 static void ata_eh_link_autopsy(struct ata_link *link)
2120 {
2121         struct ata_port *ap = link->ap;
2122         struct ata_eh_context *ehc = &link->eh_context;
2123         struct ata_device *dev;
2124         unsigned int all_err_mask = 0, eflags = 0;
2125         int tag;
2126         u32 serror;
2127         int rc;
2128
2129         DPRINTK("ENTER\n");
2130
2131         if (ehc->i.flags & ATA_EHI_NO_AUTOPSY)
2132                 return;
2133
2134         /* obtain and analyze SError */
2135         rc = sata_scr_read(link, SCR_ERROR, &serror);
2136         if (rc == 0) {
2137                 ehc->i.serror |= serror;
2138                 ata_eh_analyze_serror(link);
2139         } else if (rc != -EOPNOTSUPP) {
2140                 /* SError read failed, force reset and probing */
2141                 ehc->i.probe_mask |= ATA_ALL_DEVICES;
2142                 ehc->i.action |= ATA_EH_RESET;
2143                 ehc->i.err_mask |= AC_ERR_OTHER;
2144         }
2145
2146         /* analyze NCQ failure */
2147         ata_eh_analyze_ncq_error(link);
2148
2149         /* any real error trumps AC_ERR_OTHER */
2150         if (ehc->i.err_mask & ~AC_ERR_OTHER)
2151                 ehc->i.err_mask &= ~AC_ERR_OTHER;
2152
2153         all_err_mask |= ehc->i.err_mask;
2154
2155         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2156                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2157
2158                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2159                     ata_dev_phys_link(qc->dev) != link)
2160                         continue;
2161
2162                 /* inherit upper level err_mask */
2163                 qc->err_mask |= ehc->i.err_mask;
2164
2165                 /* analyze TF */
2166                 ehc->i.action |= ata_eh_analyze_tf(qc, &qc->result_tf);
2167
2168                 /* DEV errors are probably spurious in case of ATA_BUS error */
2169                 if (qc->err_mask & AC_ERR_ATA_BUS)
2170                         qc->err_mask &= ~(AC_ERR_DEV | AC_ERR_MEDIA |
2171                                           AC_ERR_INVALID);
2172
2173                 /* any real error trumps unknown error */
2174                 if (qc->err_mask & ~AC_ERR_OTHER)
2175                         qc->err_mask &= ~AC_ERR_OTHER;
2176
2177                 /* SENSE_VALID trumps dev/unknown error and revalidation */
2178                 if (qc->flags & ATA_QCFLAG_SENSE_VALID)
2179                         qc->err_mask &= ~(AC_ERR_DEV | AC_ERR_OTHER);
2180
2181                 /* determine whether the command is worth retrying */
2182                 if (ata_eh_worth_retry(qc))
2183                         qc->flags |= ATA_QCFLAG_RETRY;
2184
2185                 /* accumulate error info */
2186                 ehc->i.dev = qc->dev;
2187                 all_err_mask |= qc->err_mask;
2188                 if (qc->flags & ATA_QCFLAG_IO)
2189                         eflags |= ATA_EFLAG_IS_IO;
2190         }
2191
2192         /* enforce default EH actions */
2193         if (ap->pflags & ATA_PFLAG_FROZEN ||
2194             all_err_mask & (AC_ERR_HSM | AC_ERR_TIMEOUT))
2195                 ehc->i.action |= ATA_EH_RESET;
2196         else if (((eflags & ATA_EFLAG_IS_IO) && all_err_mask) ||
2197                  (!(eflags & ATA_EFLAG_IS_IO) && (all_err_mask & ~AC_ERR_DEV)))
2198                 ehc->i.action |= ATA_EH_REVALIDATE;
2199
2200         /* If we have offending qcs and the associated failed device,
2201          * perform per-dev EH action only on the offending device.
2202          */
2203         if (ehc->i.dev) {
2204                 ehc->i.dev_action[ehc->i.dev->devno] |=
2205                         ehc->i.action & ATA_EH_PERDEV_MASK;
2206                 ehc->i.action &= ~ATA_EH_PERDEV_MASK;
2207         }
2208
2209         /* propagate timeout to host link */
2210         if ((all_err_mask & AC_ERR_TIMEOUT) && !ata_is_host_link(link))
2211                 ap->link.eh_context.i.err_mask |= AC_ERR_TIMEOUT;
2212
2213         /* record error and consider speeding down */
2214         dev = ehc->i.dev;
2215         if (!dev && ((ata_link_max_devices(link) == 1 &&
2216                       ata_dev_enabled(link->device))))
2217             dev = link->device;
2218
2219         if (dev) {
2220                 if (dev->flags & ATA_DFLAG_DUBIOUS_XFER)
2221                         eflags |= ATA_EFLAG_DUBIOUS_XFER;
2222                 ehc->i.action |= ata_eh_speed_down(dev, eflags, all_err_mask);
2223         }
2224
2225         DPRINTK("EXIT\n");
2226 }
2227
2228 /**
2229  *      ata_eh_autopsy - analyze error and determine recovery action
2230  *      @ap: host port to perform autopsy on
2231  *
2232  *      Analyze all links of @ap and determine why they failed and
2233  *      which recovery actions are needed.
2234  *
2235  *      LOCKING:
2236  *      Kernel thread context (may sleep).
2237  */
2238 void ata_eh_autopsy(struct ata_port *ap)
2239 {
2240         struct ata_link *link;
2241
2242         ata_for_each_link(link, ap, EDGE)
2243                 ata_eh_link_autopsy(link);
2244
2245         /* Handle the frigging slave link.  Autopsy is done similarly
2246          * but actions and flags are transferred over to the master
2247          * link and handled from there.
2248          */
2249         if (ap->slave_link) {
2250                 struct ata_eh_context *mehc = &ap->link.eh_context;
2251                 struct ata_eh_context *sehc = &ap->slave_link->eh_context;
2252
2253                 /* transfer control flags from master to slave */
2254                 sehc->i.flags |= mehc->i.flags & ATA_EHI_TO_SLAVE_MASK;
2255
2256                 /* perform autopsy on the slave link */
2257                 ata_eh_link_autopsy(ap->slave_link);
2258
2259                 /* transfer actions from slave to master and clear slave */
2260                 ata_eh_about_to_do(ap->slave_link, NULL, ATA_EH_ALL_ACTIONS);
2261                 mehc->i.action          |= sehc->i.action;
2262                 mehc->i.dev_action[1]   |= sehc->i.dev_action[1];
2263                 mehc->i.flags           |= sehc->i.flags;
2264                 ata_eh_done(ap->slave_link, NULL, ATA_EH_ALL_ACTIONS);
2265         }
2266
2267         /* Autopsy of fanout ports can affect host link autopsy.
2268          * Perform host link autopsy last.
2269          */
2270         if (sata_pmp_attached(ap))
2271                 ata_eh_link_autopsy(&ap->link);
2272 }
2273
2274 /**
2275  *      ata_get_cmd_descript - get description for ATA command
2276  *      @command: ATA command code to get description for
2277  *
2278  *      Return a textual description of the given command, or NULL if the
2279  *      command is not known.
2280  *
2281  *      LOCKING:
2282  *      None
2283  */
2284 const char *ata_get_cmd_descript(u8 command)
2285 {
2286 #ifdef CONFIG_ATA_VERBOSE_ERROR
2287         static const struct
2288         {
2289                 u8 command;
2290                 const char *text;
2291         } cmd_descr[] = {
2292                 { ATA_CMD_DEV_RESET,            "DEVICE RESET" },
2293                 { ATA_CMD_CHK_POWER,            "CHECK POWER MODE" },
2294                 { ATA_CMD_STANDBY,              "STANDBY" },
2295                 { ATA_CMD_IDLE,                 "IDLE" },
2296                 { ATA_CMD_EDD,                  "EXECUTE DEVICE DIAGNOSTIC" },
2297                 { ATA_CMD_DOWNLOAD_MICRO,       "DOWNLOAD MICROCODE" },
2298                 { ATA_CMD_DOWNLOAD_MICRO_DMA,   "DOWNLOAD MICROCODE DMA" },
2299                 { ATA_CMD_NOP,                  "NOP" },
2300                 { ATA_CMD_FLUSH,                "FLUSH CACHE" },
2301                 { ATA_CMD_FLUSH_EXT,            "FLUSH CACHE EXT" },
2302                 { ATA_CMD_ID_ATA,               "IDENTIFY DEVICE" },
2303                 { ATA_CMD_ID_ATAPI,             "IDENTIFY PACKET DEVICE" },
2304                 { ATA_CMD_SERVICE,              "SERVICE" },
2305                 { ATA_CMD_READ,                 "READ DMA" },
2306                 { ATA_CMD_READ_EXT,             "READ DMA EXT" },
2307                 { ATA_CMD_READ_QUEUED,          "READ DMA QUEUED" },
2308                 { ATA_CMD_READ_STREAM_EXT,      "READ STREAM EXT" },
2309                 { ATA_CMD_READ_STREAM_DMA_EXT,  "READ STREAM DMA EXT" },
2310                 { ATA_CMD_WRITE,                "WRITE DMA" },
2311                 { ATA_CMD_WRITE_EXT,            "WRITE DMA EXT" },
2312                 { ATA_CMD_WRITE_QUEUED,         "WRITE DMA QUEUED EXT" },
2313                 { ATA_CMD_WRITE_STREAM_EXT,     "WRITE STREAM EXT" },
2314                 { ATA_CMD_WRITE_STREAM_DMA_EXT, "WRITE STREAM DMA EXT" },
2315                 { ATA_CMD_WRITE_FUA_EXT,        "WRITE DMA FUA EXT" },
2316                 { ATA_CMD_WRITE_QUEUED_FUA_EXT, "WRITE DMA QUEUED FUA EXT" },
2317                 { ATA_CMD_FPDMA_READ,           "READ FPDMA QUEUED" },
2318                 { ATA_CMD_FPDMA_WRITE,          "WRITE FPDMA QUEUED" },
2319                 { ATA_CMD_FPDMA_SEND,           "SEND FPDMA QUEUED" },
2320                 { ATA_CMD_FPDMA_RECV,           "RECEIVE FPDMA QUEUED" },
2321                 { ATA_CMD_PIO_READ,             "READ SECTOR(S)" },
2322                 { ATA_CMD_PIO_READ_EXT,         "READ SECTOR(S) EXT" },
2323                 { ATA_CMD_PIO_WRITE,            "WRITE SECTOR(S)" },
2324                 { ATA_CMD_PIO_WRITE_EXT,        "WRITE SECTOR(S) EXT" },
2325                 { ATA_CMD_READ_MULTI,           "READ MULTIPLE" },
2326                 { ATA_CMD_READ_MULTI_EXT,       "READ MULTIPLE EXT" },
2327                 { ATA_CMD_WRITE_MULTI,          "WRITE MULTIPLE" },
2328                 { ATA_CMD_WRITE_MULTI_EXT,      "WRITE MULTIPLE EXT" },
2329                 { ATA_CMD_WRITE_MULTI_FUA_EXT,  "WRITE MULTIPLE FUA EXT" },
2330                 { ATA_CMD_SET_FEATURES,         "SET FEATURES" },
2331                 { ATA_CMD_SET_MULTI,            "SET MULTIPLE MODE" },
2332                 { ATA_CMD_VERIFY,               "READ VERIFY SECTOR(S)" },
2333                 { ATA_CMD_VERIFY_EXT,           "READ VERIFY SECTOR(S) EXT" },
2334                 { ATA_CMD_WRITE_UNCORR_EXT,     "WRITE UNCORRECTABLE EXT" },
2335                 { ATA_CMD_STANDBYNOW1,          "STANDBY IMMEDIATE" },
2336                 { ATA_CMD_IDLEIMMEDIATE,        "IDLE IMMEDIATE" },
2337                 { ATA_CMD_SLEEP,                "SLEEP" },
2338                 { ATA_CMD_INIT_DEV_PARAMS,      "INITIALIZE DEVICE PARAMETERS" },
2339                 { ATA_CMD_READ_NATIVE_MAX,      "READ NATIVE MAX ADDRESS" },
2340                 { ATA_CMD_READ_NATIVE_MAX_EXT,  "READ NATIVE MAX ADDRESS EXT" },
2341                 { ATA_CMD_SET_MAX,              "SET MAX ADDRESS" },
2342                 { ATA_CMD_SET_MAX_EXT,          "SET MAX ADDRESS EXT" },
2343                 { ATA_CMD_READ_LOG_EXT,         "READ LOG EXT" },
2344                 { ATA_CMD_WRITE_LOG_EXT,        "WRITE LOG EXT" },
2345                 { ATA_CMD_READ_LOG_DMA_EXT,     "READ LOG DMA EXT" },
2346                 { ATA_CMD_WRITE_LOG_DMA_EXT,    "WRITE LOG DMA EXT" },
2347                 { ATA_CMD_TRUSTED_NONDATA,      "TRUSTED NON-DATA" },
2348                 { ATA_CMD_TRUSTED_RCV,          "TRUSTED RECEIVE" },
2349                 { ATA_CMD_TRUSTED_RCV_DMA,      "TRUSTED RECEIVE DMA" },
2350                 { ATA_CMD_TRUSTED_SND,          "TRUSTED SEND" },
2351                 { ATA_CMD_TRUSTED_SND_DMA,      "TRUSTED SEND DMA" },
2352                 { ATA_CMD_PMP_READ,             "READ BUFFER" },
2353                 { ATA_CMD_PMP_READ_DMA,         "READ BUFFER DMA" },
2354                 { ATA_CMD_PMP_WRITE,            "WRITE BUFFER" },
2355                 { ATA_CMD_PMP_WRITE_DMA,        "WRITE BUFFER DMA" },
2356                 { ATA_CMD_CONF_OVERLAY,         "DEVICE CONFIGURATION OVERLAY" },
2357                 { ATA_CMD_SEC_SET_PASS,         "SECURITY SET PASSWORD" },
2358                 { ATA_CMD_SEC_UNLOCK,           "SECURITY UNLOCK" },
2359                 { ATA_CMD_SEC_ERASE_PREP,       "SECURITY ERASE PREPARE" },
2360                 { ATA_CMD_SEC_ERASE_UNIT,       "SECURITY ERASE UNIT" },
2361                 { ATA_CMD_SEC_FREEZE_LOCK,      "SECURITY FREEZE LOCK" },
2362                 { ATA_CMD_SEC_DISABLE_PASS,     "SECURITY DISABLE PASSWORD" },
2363                 { ATA_CMD_CONFIG_STREAM,        "CONFIGURE STREAM" },
2364                 { ATA_CMD_SMART,                "SMART" },
2365                 { ATA_CMD_MEDIA_LOCK,           "DOOR LOCK" },
2366                 { ATA_CMD_MEDIA_UNLOCK,         "DOOR UNLOCK" },
2367                 { ATA_CMD_DSM,                  "DATA SET MANAGEMENT" },
2368                 { ATA_CMD_CHK_MED_CRD_TYP,      "CHECK MEDIA CARD TYPE" },
2369                 { ATA_CMD_CFA_REQ_EXT_ERR,      "CFA REQUEST EXTENDED ERROR" },
2370                 { ATA_CMD_CFA_WRITE_NE,         "CFA WRITE SECTORS WITHOUT ERASE" },
2371                 { ATA_CMD_CFA_TRANS_SECT,       "CFA TRANSLATE SECTOR" },
2372                 { ATA_CMD_CFA_ERASE,            "CFA ERASE SECTORS" },
2373                 { ATA_CMD_CFA_WRITE_MULT_NE,    "CFA WRITE MULTIPLE WITHOUT ERASE" },
2374                 { ATA_CMD_REQ_SENSE_DATA,       "REQUEST SENSE DATA EXT" },
2375                 { ATA_CMD_SANITIZE_DEVICE,      "SANITIZE DEVICE" },
2376                 { ATA_CMD_READ_LONG,            "READ LONG (with retries)" },
2377                 { ATA_CMD_READ_LONG_ONCE,       "READ LONG (without retries)" },
2378                 { ATA_CMD_WRITE_LONG,           "WRITE LONG (with retries)" },
2379                 { ATA_CMD_WRITE_LONG_ONCE,      "WRITE LONG (without retries)" },
2380                 { ATA_CMD_RESTORE,              "RECALIBRATE" },
2381                 { 0,                            NULL } /* terminate list */
2382         };
2383
2384         unsigned int i;
2385         for (i = 0; cmd_descr[i].text; i++)
2386                 if (cmd_descr[i].command == command)
2387                         return cmd_descr[i].text;
2388 #endif
2389
2390         return NULL;
2391 }
2392 EXPORT_SYMBOL_GPL(ata_get_cmd_descript);
2393
2394 /**
2395  *      ata_eh_link_report - report error handling to user
2396  *      @link: ATA link EH is going on
2397  *
2398  *      Report EH to user.
2399  *
2400  *      LOCKING:
2401  *      None.
2402  */
2403 static void ata_eh_link_report(struct ata_link *link)
2404 {
2405         struct ata_port *ap = link->ap;
2406         struct ata_eh_context *ehc = &link->eh_context;
2407         const char *frozen, *desc;
2408         char tries_buf[6] = "";
2409         int tag, nr_failed = 0;
2410
2411         if (ehc->i.flags & ATA_EHI_QUIET)
2412                 return;
2413
2414         desc = NULL;
2415         if (ehc->i.desc[0] != '\0')
2416                 desc = ehc->i.desc;
2417
2418         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2419                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2420
2421                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2422                     ata_dev_phys_link(qc->dev) != link ||
2423                     ((qc->flags & ATA_QCFLAG_QUIET) &&
2424                      qc->err_mask == AC_ERR_DEV))
2425                         continue;
2426                 if (qc->flags & ATA_QCFLAG_SENSE_VALID && !qc->err_mask)
2427                         continue;
2428
2429                 nr_failed++;
2430         }
2431
2432         if (!nr_failed && !ehc->i.err_mask)
2433                 return;
2434
2435         frozen = "";
2436         if (ap->pflags & ATA_PFLAG_FROZEN)
2437                 frozen = " frozen";
2438
2439         if (ap->eh_tries < ATA_EH_MAX_TRIES)
2440                 snprintf(tries_buf, sizeof(tries_buf), " t%d",
2441                          ap->eh_tries);
2442
2443         if (ehc->i.dev) {
2444                 ata_dev_err(ehc->i.dev, "exception Emask 0x%x "
2445                             "SAct 0x%x SErr 0x%x action 0x%x%s%s\n",
2446                             ehc->i.err_mask, link->sactive, ehc->i.serror,
2447                             ehc->i.action, frozen, tries_buf);
2448                 if (desc)
2449                         ata_dev_err(ehc->i.dev, "%s\n", desc);
2450         } else {
2451                 ata_link_err(link, "exception Emask 0x%x "
2452                              "SAct 0x%x SErr 0x%x action 0x%x%s%s\n",
2453                              ehc->i.err_mask, link->sactive, ehc->i.serror,
2454                              ehc->i.action, frozen, tries_buf);
2455                 if (desc)
2456                         ata_link_err(link, "%s\n", desc);
2457         }
2458
2459 #ifdef CONFIG_ATA_VERBOSE_ERROR
2460         if (ehc->i.serror)
2461                 ata_link_err(link,
2462                   "SError: { %s%s%s%s%s%s%s%s%s%s%s%s%s%s%s%s%s}\n",
2463                   ehc->i.serror & SERR_DATA_RECOVERED ? "RecovData " : "",
2464                   ehc->i.serror & SERR_COMM_RECOVERED ? "RecovComm " : "",
2465                   ehc->i.serror & SERR_DATA ? "UnrecovData " : "",
2466                   ehc->i.serror & SERR_PERSISTENT ? "Persist " : "",
2467                   ehc->i.serror & SERR_PROTOCOL ? "Proto " : "",
2468                   ehc->i.serror & SERR_INTERNAL ? "HostInt " : "",
2469                   ehc->i.serror & SERR_PHYRDY_CHG ? "PHYRdyChg " : "",
2470                   ehc->i.serror & SERR_PHY_INT_ERR ? "PHYInt " : "",
2471                   ehc->i.serror & SERR_COMM_WAKE ? "CommWake " : "",
2472                   ehc->i.serror & SERR_10B_8B_ERR ? "10B8B " : "",
2473                   ehc->i.serror & SERR_DISPARITY ? "Dispar " : "",
2474                   ehc->i.serror & SERR_CRC ? "BadCRC " : "",
2475                   ehc->i.serror & SERR_HANDSHAKE ? "Handshk " : "",
2476                   ehc->i.serror & SERR_LINK_SEQ_ERR ? "LinkSeq " : "",
2477                   ehc->i.serror & SERR_TRANS_ST_ERROR ? "TrStaTrns " : "",
2478                   ehc->i.serror & SERR_UNRECOG_FIS ? "UnrecFIS " : "",
2479                   ehc->i.serror & SERR_DEV_XCHG ? "DevExch " : "");
2480 #endif
2481
2482         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2483                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2484                 struct ata_taskfile *cmd = &qc->tf, *res = &qc->result_tf;
2485                 const u8 *cdb = qc->cdb;
2486                 char data_buf[20] = "";
2487                 char cdb_buf[70] = "";
2488
2489                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2490                     ata_dev_phys_link(qc->dev) != link || !qc->err_mask)
2491                         continue;
2492
2493                 if (qc->dma_dir != DMA_NONE) {
2494                         static const char *dma_str[] = {
2495                                 [DMA_BIDIRECTIONAL]     = "bidi",
2496                                 [DMA_TO_DEVICE]         = "out",
2497                                 [DMA_FROM_DEVICE]       = "in",
2498                         };
2499                         static const char *prot_str[] = {
2500                                 [ATA_PROT_PIO]          = "pio",
2501                                 [ATA_PROT_DMA]          = "dma",
2502                                 [ATA_PROT_NCQ]          = "ncq",
2503                                 [ATAPI_PROT_PIO]        = "pio",
2504                                 [ATAPI_PROT_DMA]        = "dma",
2505                         };
2506
2507                         snprintf(data_buf, sizeof(data_buf), " %s %u %s",
2508                                  prot_str[qc->tf.protocol], qc->nbytes,
2509                                  dma_str[qc->dma_dir]);
2510                 }
2511
2512                 if (ata_is_atapi(qc->tf.protocol)) {
2513                         if (qc->scsicmd)
2514                                 scsi_print_command(qc->scsicmd);
2515                         else
2516                                 snprintf(cdb_buf, sizeof(cdb_buf),
2517                                  "cdb %02x %02x %02x %02x %02x %02x %02x %02x  "
2518                                  "%02x %02x %02x %02x %02x %02x %02x %02x\n         ",
2519                                  cdb[0], cdb[1], cdb[2], cdb[3],
2520                                  cdb[4], cdb[5], cdb[6], cdb[7],
2521                                  cdb[8], cdb[9], cdb[10], cdb[11],
2522                                  cdb[12], cdb[13], cdb[14], cdb[15]);
2523                 } else {
2524                         const char *descr = ata_get_cmd_descript(cmd->command);
2525                         if (descr)
2526                                 ata_dev_err(qc->dev, "failed command: %s\n",
2527                                             descr);
2528                 }
2529
2530                 ata_dev_err(qc->dev,
2531                         "cmd %02x/%02x:%02x:%02x:%02x:%02x/%02x:%02x:%02x:%02x:%02x/%02x "
2532                         "tag %d%s\n         %s"
2533                         "res %02x/%02x:%02x:%02x:%02x:%02x/%02x:%02x:%02x:%02x:%02x/%02x "
2534                         "Emask 0x%x (%s)%s\n",
2535                         cmd->command, cmd->feature, cmd->nsect,
2536                         cmd->lbal, cmd->lbam, cmd->lbah,
2537                         cmd->hob_feature, cmd->hob_nsect,
2538                         cmd->hob_lbal, cmd->hob_lbam, cmd->hob_lbah,
2539                         cmd->device, qc->tag, data_buf, cdb_buf,
2540                         res->command, res->feature, res->nsect,
2541                         res->lbal, res->lbam, res->lbah,
2542                         res->hob_feature, res->hob_nsect,
2543                         res->hob_lbal, res->hob_lbam, res->hob_lbah,
2544                         res->device, qc->err_mask, ata_err_string(qc->err_mask),
2545                         qc->err_mask & AC_ERR_NCQ ? " <F>" : "");
2546
2547 #ifdef CONFIG_ATA_VERBOSE_ERROR
2548                 if (res->command & (ATA_BUSY | ATA_DRDY | ATA_DF | ATA_DRQ |
2549                                     ATA_ERR)) {
2550                         if (res->command & ATA_BUSY)
2551                                 ata_dev_err(qc->dev, "status: { Busy }\n");
2552                         else
2553                                 ata_dev_err(qc->dev, "status: { %s%s%s%s}\n",
2554                                   res->command & ATA_DRDY ? "DRDY " : "",
2555                                   res->command & ATA_DF ? "DF " : "",
2556                                   res->command & ATA_DRQ ? "DRQ " : "",
2557                                   res->command & ATA_ERR ? "ERR " : "");
2558                 }
2559
2560                 if (cmd->command != ATA_CMD_PACKET &&
2561                     (res->feature & (ATA_ICRC | ATA_UNC | ATA_AMNF |
2562                                      ATA_IDNF | ATA_ABORTED)))
2563                         ata_dev_err(qc->dev, "error: { %s%s%s%s%s}\n",
2564                           res->feature & ATA_ICRC ? "ICRC " : "",
2565                           res->feature & ATA_UNC ? "UNC " : "",
2566                           res->feature & ATA_AMNF ? "AMNF " : "",
2567                           res->feature & ATA_IDNF ? "IDNF " : "",
2568                           res->feature & ATA_ABORTED ? "ABRT " : "");
2569 #endif
2570         }
2571 }
2572
2573 /**
2574  *      ata_eh_report - report error handling to user
2575  *      @ap: ATA port to report EH about
2576  *
2577  *      Report EH to user.
2578  *
2579  *      LOCKING:
2580  *      None.
2581  */
2582 void ata_eh_report(struct ata_port *ap)
2583 {
2584         struct ata_link *link;
2585
2586         ata_for_each_link(link, ap, HOST_FIRST)
2587                 ata_eh_link_report(link);
2588 }
2589
2590 static int ata_do_reset(struct ata_link *link, ata_reset_fn_t reset,
2591                         unsigned int *classes, unsigned long deadline,
2592                         bool clear_classes)
2593 {
2594         struct ata_device *dev;
2595
2596         if (clear_classes)
2597                 ata_for_each_dev(dev, link, ALL)
2598                         classes[dev->devno] = ATA_DEV_UNKNOWN;
2599
2600         return reset(link, classes, deadline);
2601 }
2602
2603 static int ata_eh_followup_srst_needed(struct ata_link *link, int rc)
2604 {
2605         if ((link->flags & ATA_LFLAG_NO_SRST) || ata_link_offline(link))
2606                 return 0;
2607         if (rc == -EAGAIN)
2608                 return 1;
2609         if (sata_pmp_supported(link->ap) && ata_is_host_link(link))
2610                 return 1;
2611         return 0;
2612 }
2613
2614 int ata_eh_reset(struct ata_link *link, int classify,
2615                  ata_prereset_fn_t prereset, ata_reset_fn_t softreset,
2616                  ata_reset_fn_t hardreset, ata_postreset_fn_t postreset)
2617 {
2618         struct ata_port *ap = link->ap;
2619         struct ata_link *slave = ap->slave_link;
2620         struct ata_eh_context *ehc = &link->eh_context;
2621         struct ata_eh_context *sehc = slave ? &slave->eh_context : NULL;
2622         unsigned int *classes = ehc->classes;
2623         unsigned int lflags = link->flags;
2624         int verbose = !(ehc->i.flags & ATA_EHI_QUIET);
2625         int max_tries = 0, try = 0;
2626         struct ata_link *failed_link;
2627         struct ata_device *dev;
2628         unsigned long deadline, now;
2629         ata_reset_fn_t reset;
2630         unsigned long flags;
2631         u32 sstatus;
2632         int nr_unknown, rc;
2633
2634         /*
2635          * Prepare to reset
2636          */
2637         while (ata_eh_reset_timeouts[max_tries] != ULONG_MAX)
2638                 max_tries++;
2639         if (link->flags & ATA_LFLAG_RST_ONCE)
2640                 max_tries = 1;
2641         if (link->flags & ATA_LFLAG_NO_HRST)
2642                 hardreset = NULL;
2643         if (link->flags & ATA_LFLAG_NO_SRST)
2644                 softreset = NULL;
2645
2646         /* make sure each reset attempt is at least COOL_DOWN apart */
2647         if (ehc->i.flags & ATA_EHI_DID_RESET) {
2648                 now = jiffies;
2649                 WARN_ON(time_after(ehc->last_reset, now));
2650                 deadline = ata_deadline(ehc->last_reset,
2651                                         ATA_EH_RESET_COOL_DOWN);
2652                 if (time_before(now, deadline))
2653                         schedule_timeout_uninterruptible(deadline - now);
2654         }
2655
2656         spin_lock_irqsave(ap->lock, flags);
2657         ap->pflags |= ATA_PFLAG_RESETTING;
2658         spin_unlock_irqrestore(ap->lock, flags);
2659
2660         ata_eh_about_to_do(link, NULL, ATA_EH_RESET);
2661
2662         ata_for_each_dev(dev, link, ALL) {
2663                 /* If we issue an SRST then an ATA drive (not ATAPI)
2664                  * may change configuration and be in PIO0 timing. If
2665                  * we do a hard reset (or are coming from power on)
2666                  * this is true for ATA or ATAPI. Until we've set a
2667                  * suitable controller mode we should not touch the
2668                  * bus as we may be talking too fast.
2669                  */
2670                 dev->pio_mode = XFER_PIO_0;
2671                 dev->dma_mode = 0xff;
2672
2673                 /* If the controller has a pio mode setup function
2674                  * then use it to set the chipset to rights. Don't
2675                  * touch the DMA setup as that will be dealt with when
2676                  * configuring devices.
2677                  */
2678                 if (ap->ops->set_piomode)
2679                         ap->ops->set_piomode(ap, dev);
2680         }
2681
2682         /* prefer hardreset */
2683         reset = NULL;
2684         ehc->i.action &= ~ATA_EH_RESET;
2685         if (hardreset) {
2686                 reset = hardreset;
2687                 ehc->i.action |= ATA_EH_HARDRESET;
2688         } else if (softreset) {
2689                 reset = softreset;
2690                 ehc->i.action |= ATA_EH_SOFTRESET;
2691         }
2692
2693         if (prereset) {
2694                 unsigned long deadline = ata_deadline(jiffies,
2695                                                       ATA_EH_PRERESET_TIMEOUT);
2696
2697                 if (slave) {
2698                         sehc->i.action &= ~ATA_EH_RESET;
2699                         sehc->i.action |= ehc->i.action;
2700                 }
2701
2702                 rc = prereset(link, deadline);
2703
2704                 /* If present, do prereset on slave link too.  Reset
2705                  * is skipped iff both master and slave links report
2706                  * -ENOENT or clear ATA_EH_RESET.
2707                  */
2708                 if (slave && (rc == 0 || rc == -ENOENT)) {
2709                         int tmp;
2710
2711                         tmp = prereset(slave, deadline);
2712                         if (tmp != -ENOENT)
2713                                 rc = tmp;
2714
2715                         ehc->i.action |= sehc->i.action;
2716                 }
2717
2718                 if (rc) {
2719                         if (rc == -ENOENT) {
2720                                 ata_link_dbg(link, "port disabled--ignoring\n");
2721                                 ehc->i.action &= ~ATA_EH_RESET;
2722
2723                                 ata_for_each_dev(dev, link, ALL)
2724                                         classes[dev->devno] = ATA_DEV_NONE;
2725
2726                                 rc = 0;
2727                         } else
2728                                 ata_link_err(link,
2729                                              "prereset failed (errno=%d)\n",
2730                                              rc);
2731                         goto out;
2732                 }
2733
2734                 /* prereset() might have cleared ATA_EH_RESET.  If so,
2735                  * bang classes, thaw and return.
2736                  */
2737                 if (reset && !(ehc->i.action & ATA_EH_RESET)) {
2738                         ata_for_each_dev(dev, link, ALL)
2739                                 classes[dev->devno] = ATA_DEV_NONE;
2740                         if ((ap->pflags & ATA_PFLAG_FROZEN) &&
2741                             ata_is_host_link(link))
2742                                 ata_eh_thaw_port(ap);
2743                         rc = 0;
2744                         goto out;
2745                 }
2746         }
2747
2748  retry:
2749         /*
2750          * Perform reset
2751          */
2752         if (ata_is_host_link(link))
2753                 ata_eh_freeze_port(ap);
2754
2755         deadline = ata_deadline(jiffies, ata_eh_reset_timeouts[try++]);
2756
2757         if (reset) {
2758                 if (verbose)
2759                         ata_link_info(link, "%s resetting link\n",
2760                                       reset == softreset ? "soft" : "hard");
2761
2762                 /* mark that this EH session started with reset */
2763                 ehc->last_reset = jiffies;
2764                 if (reset == hardreset)
2765                         ehc->i.flags |= ATA_EHI_DID_HARDRESET;
2766                 else
2767                         ehc->i.flags |= ATA_EHI_DID_SOFTRESET;
2768
2769                 rc = ata_do_reset(link, reset, classes, deadline, true);
2770                 if (rc && rc != -EAGAIN) {
2771                         failed_link = link;
2772                         goto fail;
2773                 }
2774
2775                 /* hardreset slave link if existent */
2776                 if (slave && reset == hardreset) {
2777                         int tmp;
2778
2779                         if (verbose)
2780                                 ata_link_info(slave, "hard resetting link\n");
2781
2782                         ata_eh_about_to_do(slave, NULL, ATA_EH_RESET);
2783                         tmp = ata_do_reset(slave, reset, classes, deadline,
2784                                            false);
2785                         switch (tmp) {
2786                         case -EAGAIN:
2787                                 rc = -EAGAIN;
2788                         case 0:
2789                                 break;
2790                         default:
2791                                 failed_link = slave;
2792                                 rc = tmp;
2793                                 goto fail;
2794                         }
2795                 }
2796
2797                 /* perform follow-up SRST if necessary */
2798                 if (reset == hardreset &&
2799                     ata_eh_followup_srst_needed(link, rc)) {
2800                         reset = softreset;
2801
2802                         if (!reset) {
2803                                 ata_link_err(link,
2804              "follow-up softreset required but no softreset available\n");
2805                                 failed_link = link;
2806                                 rc = -EINVAL;
2807                                 goto fail;
2808                         }
2809
2810                         ata_eh_about_to_do(link, NULL, ATA_EH_RESET);
2811                         rc = ata_do_reset(link, reset, classes, deadline, true);
2812                         if (rc) {
2813                                 failed_link = link;
2814                                 goto fail;
2815                         }
2816                 }
2817         } else {
2818                 if (verbose)
2819                         ata_link_info(link,
2820         "no reset method available, skipping reset\n");
2821                 if (!(lflags & ATA_LFLAG_ASSUME_CLASS))
2822                         lflags |= ATA_LFLAG_ASSUME_ATA;
2823         }
2824
2825         /*
2826          * Post-reset processing
2827          */
2828         ata_for_each_dev(dev, link, ALL) {
2829                 /* After the reset, the device state is PIO 0 and the
2830                  * controller state is undefined.  Reset also wakes up
2831                  * drives from sleeping mode.
2832                  */
2833                 dev->pio_mode = XFER_PIO_0;
2834                 dev->flags &= ~ATA_DFLAG_SLEEPING;
2835
2836                 if (ata_phys_link_offline(ata_dev_phys_link(dev)))
2837                         continue;
2838
2839                 /* apply class override */
2840                 if (lflags & ATA_LFLAG_ASSUME_ATA)
2841                         classes[dev->devno] = ATA_DEV_ATA;
2842                 else if (lflags & ATA_LFLAG_ASSUME_SEMB)
2843                         classes[dev->devno] = ATA_DEV_SEMB_UNSUP;
2844         }
2845
2846         /* record current link speed */
2847         if (sata_scr_read(link, SCR_STATUS, &sstatus) == 0)
2848                 link->sata_spd = (sstatus >> 4) & 0xf;
2849         if (slave && sata_scr_read(slave, SCR_STATUS, &sstatus) == 0)
2850                 slave->sata_spd = (sstatus >> 4) & 0xf;
2851
2852         /* thaw the port */
2853         if (ata_is_host_link(link))
2854                 ata_eh_thaw_port(ap);
2855
2856         /* postreset() should clear hardware SError.  Although SError
2857          * is cleared during link resume, clearing SError here is
2858          * necessary as some PHYs raise hotplug events after SRST.
2859          * This introduces race condition where hotplug occurs between
2860          * reset and here.  This race is mediated by cross checking
2861          * link onlineness and classification result later.
2862          */
2863         if (postreset) {
2864                 postreset(link, classes);
2865                 if (slave)
2866                         postreset(slave, classes);
2867         }
2868
2869         /*
2870          * Some controllers can't be frozen very well and may set spurious
2871          * error conditions during reset.  Clear accumulated error
2872          * information and re-thaw the port if frozen.  As reset is the
2873          * final recovery action and we cross check link onlineness against
2874          * device classification later, no hotplug event is lost by this.
2875          */
2876         spin_lock_irqsave(link->ap->lock, flags);
2877         memset(&link->eh_info, 0, sizeof(link->eh_info));
2878         if (slave)
2879                 memset(&slave->eh_info, 0, sizeof(link->eh_info));
2880         ap->pflags &= ~ATA_PFLAG_EH_PENDING;
2881         spin_unlock_irqrestore(link->ap->lock, flags);
2882
2883         if (ap->pflags & ATA_PFLAG_FROZEN)
2884                 ata_eh_thaw_port(ap);
2885
2886         /*
2887          * Make sure onlineness and classification result correspond.
2888          * Hotplug could have happened during reset and some
2889          * controllers fail to wait while a drive is spinning up after
2890          * being hotplugged causing misdetection.  By cross checking
2891          * link on/offlineness and classification result, those
2892          * conditions can be reliably detected and retried.
2893          */
2894         nr_unknown = 0;
2895         ata_for_each_dev(dev, link, ALL) {
2896                 if (ata_phys_link_online(ata_dev_phys_link(dev))) {
2897                         if (classes[dev->devno] == ATA_DEV_UNKNOWN) {
2898                                 ata_dev_dbg(dev, "link online but device misclassified\n");
2899                                 classes[dev->devno] = ATA_DEV_NONE;
2900                                 nr_unknown++;
2901                         }
2902                 } else if (ata_phys_link_offline(ata_dev_phys_link(dev))) {
2903                         if (ata_class_enabled(classes[dev->devno]))
2904                                 ata_dev_dbg(dev,
2905                                             "link offline, clearing class %d to NONE\n",
2906                                             classes[dev->devno]);
2907                         classes[dev->devno] = ATA_DEV_NONE;
2908                 } else if (classes[dev->devno] == ATA_DEV_UNKNOWN) {
2909                         ata_dev_dbg(dev,
2910                                     "link status unknown, clearing UNKNOWN to NONE\n");
2911                         classes[dev->devno] = ATA_DEV_NONE;
2912                 }
2913         }
2914
2915         if (classify && nr_unknown) {
2916                 if (try < max_tries) {
2917                         ata_link_warn(link,
2918                                       "link online but %d devices misclassified, retrying\n",
2919                                       nr_unknown);
2920                         failed_link = link;
2921                         rc = -EAGAIN;
2922                         goto fail;
2923                 }
2924                 ata_link_warn(link,
2925                               "link online but %d devices misclassified, "
2926                               "device detection might fail\n", nr_unknown);
2927         }
2928
2929         /* reset successful, schedule revalidation */
2930         ata_eh_done(link, NULL, ATA_EH_RESET);
2931         if (slave)
2932                 ata_eh_done(slave, NULL, ATA_EH_RESET);
2933         ehc->last_reset = jiffies;              /* update to completion time */
2934         ehc->i.action |= ATA_EH_REVALIDATE;
2935         link->lpm_policy = ATA_LPM_UNKNOWN;     /* reset LPM state */
2936
2937         rc = 0;
2938  out:
2939         /* clear hotplug flag */
2940         ehc->i.flags &= ~ATA_EHI_HOTPLUGGED;
2941         if (slave)
2942                 sehc->i.flags &= ~ATA_EHI_HOTPLUGGED;
2943
2944         spin_lock_irqsave(ap->lock, flags);
2945         ap->pflags &= ~ATA_PFLAG_RESETTING;
2946         spin_unlock_irqrestore(ap->lock, flags);
2947
2948         return rc;
2949
2950  fail:
2951         /* if SCR isn't accessible on a fan-out port, PMP needs to be reset */
2952         if (!ata_is_host_link(link) &&
2953             sata_scr_read(link, SCR_STATUS, &sstatus))
2954                 rc = -ERESTART;
2955
2956         if (try >= max_tries) {
2957                 /*
2958                  * Thaw host port even if reset failed, so that the port
2959                  * can be retried on the next phy event.  This risks
2960                  * repeated EH runs but seems to be a better tradeoff than
2961                  * shutting down a port after a botched hotplug attempt.
2962                  */
2963                 if (ata_is_host_link(link))
2964                         ata_eh_thaw_port(ap);
2965                 goto out;
2966         }
2967
2968         now = jiffies;
2969         if (time_before(now, deadline)) {
2970                 unsigned long delta = deadline - now;
2971
2972                 ata_link_warn(failed_link,
2973                         "reset failed (errno=%d), retrying in %u secs\n",
2974                         rc, DIV_ROUND_UP(jiffies_to_msecs(delta), 1000));
2975
2976                 ata_eh_release(ap);
2977                 while (delta)
2978                         delta = schedule_timeout_uninterruptible(delta);
2979                 ata_eh_acquire(ap);
2980         }
2981
2982         /*
2983          * While disks spinup behind PMP, some controllers fail sending SRST.
2984          * They need to be reset - as well as the PMP - before retrying.
2985          */
2986         if (rc == -ERESTART) {
2987                 if (ata_is_host_link(link))
2988                         ata_eh_thaw_port(ap);
2989                 goto out;
2990         }
2991
2992         if (try == max_tries - 1) {
2993                 sata_down_spd_limit(link, 0);
2994                 if (slave)
2995                         sata_down_spd_limit(slave, 0);
2996         } else if (rc == -EPIPE)
2997                 sata_down_spd_limit(failed_link, 0);
2998
2999         if (hardreset)
3000                 reset = hardreset;
3001         goto retry;
3002 }
3003
3004 static inline void ata_eh_pull_park_action(struct ata_port *ap)
3005 {
3006         struct ata_link *link;
3007         struct ata_device *dev;
3008         unsigned long flags;
3009
3010         /*
3011          * This function can be thought of as an extended version of
3012          * ata_eh_about_to_do() specially crafted to accommodate the
3013          * requirements of ATA_EH_PARK handling. Since the EH thread
3014          * does not leave the do {} while () loop in ata_eh_recover as
3015          * long as the timeout for a park request to *one* device on
3016          * the port has not expired, and since we still want to pick
3017          * up park requests to other devices on the same port or
3018          * timeout updates for the same device, we have to pull
3019          * ATA_EH_PARK actions from eh_info into eh_context.i
3020          * ourselves at the beginning of each pass over the loop.
3021          *
3022          * Additionally, all write accesses to &ap->park_req_pending
3023          * through reinit_completion() (see below) or complete_all()
3024          * (see ata_scsi_park_store()) are protected by the host lock.
3025          * As a result we have that park_req_pending.done is zero on
3026          * exit from this function, i.e. when ATA_EH_PARK actions for
3027          * *all* devices on port ap have been pulled into the
3028          * respective eh_context structs. If, and only if,
3029          * park_req_pending.done is non-zero by the time we reach
3030          * wait_for_completion_timeout(), another ATA_EH_PARK action
3031          * has been scheduled for at least one of the devices on port
3032          * ap and we have to cycle over the do {} while () loop in
3033          * ata_eh_recover() again.
3034          */
3035
3036         spin_lock_irqsave(ap->lock, flags);
3037         reinit_completion(&ap->park_req_pending);
3038         ata_for_each_link(link, ap, EDGE) {
3039                 ata_for_each_dev(dev, link, ALL) {
3040                         struct ata_eh_info *ehi = &link->eh_info;
3041
3042                         link->eh_context.i.dev_action[dev->devno] |=
3043                                 ehi->dev_action[dev->devno] & ATA_EH_PARK;
3044                         ata_eh_clear_action(link, dev, ehi, ATA_EH_PARK);
3045                 }
3046         }
3047         spin_unlock_irqrestore(ap->lock, flags);
3048 }
3049
3050 static void ata_eh_park_issue_cmd(struct ata_device *dev, int park)
3051 {
3052         struct ata_eh_context *ehc = &dev->link->eh_context;
3053         struct ata_taskfile tf;
3054         unsigned int err_mask;
3055
3056         ata_tf_init(dev, &tf);
3057         if (park) {
3058                 ehc->unloaded_mask |= 1 << dev->devno;
3059                 tf.command = ATA_CMD_IDLEIMMEDIATE;
3060                 tf.feature = 0x44;
3061                 tf.lbal = 0x4c;
3062                 tf.lbam = 0x4e;
3063                 tf.lbah = 0x55;
3064         } else {
3065                 ehc->unloaded_mask &= ~(1 << dev->devno);
3066                 tf.command = ATA_CMD_CHK_POWER;
3067         }
3068
3069         tf.flags |= ATA_TFLAG_DEVICE | ATA_TFLAG_ISADDR;
3070         tf.protocol |= ATA_PROT_NODATA;
3071         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_NONE, NULL, 0, 0);
3072         if (park && (err_mask || tf.lbal != 0xc4)) {
3073                 ata_dev_err(dev, "head unload failed!\n");
3074                 ehc->unloaded_mask &= ~(1 << dev->devno);
3075         }
3076 }
3077
3078 static int ata_eh_revalidate_and_attach(struct ata_link *link,
3079                                         struct ata_device **r_failed_dev)
3080 {
3081         struct ata_port *ap = link->ap;
3082         struct ata_eh_context *ehc = &link->eh_context;
3083         struct ata_device *dev;
3084         unsigned int new_mask = 0;
3085         unsigned long flags;
3086         int rc = 0;
3087
3088         DPRINTK("ENTER\n");
3089
3090         /* For PATA drive side cable detection to work, IDENTIFY must
3091          * be done backwards such that PDIAG- is released by the slave
3092          * device before the master device is identified.
3093          */
3094         ata_for_each_dev(dev, link, ALL_REVERSE) {
3095                 unsigned int action = ata_eh_dev_action(dev);
3096                 unsigned int readid_flags = 0;
3097
3098                 if (ehc->i.flags & ATA_EHI_DID_RESET)
3099                         readid_flags |= ATA_READID_POSTRESET;
3100
3101                 if ((action & ATA_EH_REVALIDATE) && ata_dev_enabled(dev)) {
3102                         WARN_ON(dev->class == ATA_DEV_PMP);
3103
3104                         if (ata_phys_link_offline(ata_dev_phys_link(dev))) {
3105                                 rc = -EIO;
3106                                 goto err;
3107                         }
3108
3109                         ata_eh_about_to_do(link, dev, ATA_EH_REVALIDATE);
3110                         rc = ata_dev_revalidate(dev, ehc->classes[dev->devno],
3111                                                 readid_flags);
3112                         if (rc)
3113                                 goto err;
3114
3115                         ata_eh_done(link, dev, ATA_EH_REVALIDATE);
3116
3117                         /* Configuration may have changed, reconfigure
3118                          * transfer mode.
3119                          */
3120                         ehc->i.flags |= ATA_EHI_SETMODE;
3121
3122                         /* schedule the scsi_rescan_device() here */
3123                         schedule_work(&(ap->scsi_rescan_task));
3124                 } else if (dev->class == ATA_DEV_UNKNOWN &&
3125                            ehc->tries[dev->devno] &&
3126                            ata_class_enabled(ehc->classes[dev->devno])) {
3127                         /* Temporarily set dev->class, it will be
3128                          * permanently set once all configurations are
3129                          * complete.  This is necessary because new
3130                          * device configuration is done in two
3131                          * separate loops.
3132                          */
3133                         dev->class = ehc->classes[dev->devno];
3134
3135                         if (dev->class == ATA_DEV_PMP)
3136                                 rc = sata_pmp_attach(dev);
3137                         else
3138                                 rc = ata_dev_read_id(dev, &dev->class,
3139                                                      readid_flags, dev->id);
3140
3141                         /* read_id might have changed class, store and reset */
3142                         ehc->classes[dev->devno] = dev->class;
3143                         dev->class = ATA_DEV_UNKNOWN;
3144
3145                         switch (rc) {
3146                         case 0:
3147                                 /* clear error info accumulated during probe */
3148                                 ata_ering_clear(&dev->ering);
3149                                 new_mask |= 1 << dev->devno;
3150                                 break;
3151                         case -ENOENT:
3152                                 /* IDENTIFY was issued to non-existent
3153                                  * device.  No need to reset.  Just
3154                                  * thaw and ignore the device.
3155                                  */
3156                                 ata_eh_thaw_port(ap);
3157                                 break;
3158                         default:
3159                                 goto err;
3160                         }
3161                 }
3162         }
3163
3164         /* PDIAG- should have been released, ask cable type if post-reset */
3165         if ((ehc->i.flags & ATA_EHI_DID_RESET) && ata_is_host_link(link)) {
3166                 if (ap->ops->cable_detect)
3167                         ap->cbl = ap->ops->cable_detect(ap);
3168                 ata_force_cbl(ap);
3169         }
3170
3171         /* Configure new devices forward such that user doesn't see
3172          * device detection messages backwards.
3173          */
3174         ata_for_each_dev(dev, link, ALL) {
3175                 if (!(new_mask & (1 << dev->devno)))
3176                         continue;
3177
3178                 dev->class = ehc->classes[dev->devno];
3179
3180                 if (dev->class == ATA_DEV_PMP)
3181                         continue;
3182
3183                 ehc->i.flags |= ATA_EHI_PRINTINFO;
3184                 rc = ata_dev_configure(dev);
3185                 ehc->i.flags &= ~ATA_EHI_PRINTINFO;
3186                 if (rc) {
3187                         dev->class = ATA_DEV_UNKNOWN;
3188                         goto err;
3189                 }
3190
3191                 spin_lock_irqsave(ap->lock, flags);
3192                 ap->pflags |= ATA_PFLAG_SCSI_HOTPLUG;
3193                 spin_unlock_irqrestore(ap->lock, flags);
3194
3195                 /* new device discovered, configure xfermode */
3196                 ehc->i.flags |= ATA_EHI_SETMODE;
3197         }
3198
3199         return 0;
3200
3201  err:
3202         *r_failed_dev = dev;
3203         DPRINTK("EXIT rc=%d\n", rc);
3204         return rc;
3205 }
3206
3207 /**
3208  *      ata_set_mode - Program timings and issue SET FEATURES - XFER
3209  *      @link: link on which timings will be programmed
3210  *      @r_failed_dev: out parameter for failed device
3211  *
3212  *      Set ATA device disk transfer mode (PIO3, UDMA6, etc.).  If
3213  *      ata_set_mode() fails, pointer to the failing device is
3214  *      returned in @r_failed_dev.
3215  *
3216  *      LOCKING:
3217  *      PCI/etc. bus probe sem.
3218  *
3219  *      RETURNS:
3220  *      0 on success, negative errno otherwise
3221  */
3222 int ata_set_mode(struct ata_link *link, struct ata_device **r_failed_dev)
3223 {
3224         struct ata_port *ap = link->ap;
3225         struct ata_device *dev;
3226         int rc;
3227
3228         /* if data transfer is verified, clear DUBIOUS_XFER on ering top */
3229         ata_for_each_dev(dev, link, ENABLED) {
3230                 if (!(dev->flags & ATA_DFLAG_DUBIOUS_XFER)) {
3231                         struct ata_ering_entry *ent;
3232
3233                         ent = ata_ering_top(&dev->ering);
3234                         if (ent)
3235                                 ent->eflags &= ~ATA_EFLAG_DUBIOUS_XFER;
3236                 }
3237         }
3238
3239         /* has private set_mode? */
3240         if (ap->ops->set_mode)
3241                 rc = ap->ops->set_mode(link, r_failed_dev);
3242         else
3243                 rc = ata_do_set_mode(link, r_failed_dev);
3244
3245         /* if transfer mode has changed, set DUBIOUS_XFER on device */
3246         ata_for_each_dev(dev, link, ENABLED) {
3247                 struct ata_eh_context *ehc = &link->eh_context;
3248                 u8 saved_xfer_mode = ehc->saved_xfer_mode[dev->devno];
3249                 u8 saved_ncq = !!(ehc->saved_ncq_enabled & (1 << dev->devno));
3250
3251                 if (dev->xfer_mode != saved_xfer_mode ||
3252                     ata_ncq_enabled(dev) != saved_ncq)
3253                         dev->flags |= ATA_DFLAG_DUBIOUS_XFER;
3254         }
3255
3256         return rc;
3257 }
3258
3259 /**
3260  *      atapi_eh_clear_ua - Clear ATAPI UNIT ATTENTION after reset
3261  *      @dev: ATAPI device to clear UA for
3262  *
3263  *      Resets and other operations can make an ATAPI device raise
3264  *      UNIT ATTENTION which causes the next operation to fail.  This
3265  *      function clears UA.
3266  *
3267  *      LOCKING:
3268  *      EH context (may sleep).
3269  *
3270  *      RETURNS:
3271  *      0 on success, -errno on failure.
3272  */
3273 static int atapi_eh_clear_ua(struct ata_device *dev)
3274 {
3275         int i;
3276
3277         for (i = 0; i < ATA_EH_UA_TRIES; i++) {
3278                 u8 *sense_buffer = dev->link->ap->sector_buf;
3279                 u8 sense_key = 0;
3280                 unsigned int err_mask;
3281
3282                 err_mask = atapi_eh_tur(dev, &sense_key);
3283                 if (err_mask != 0 && err_mask != AC_ERR_DEV) {
3284                         ata_dev_warn(dev,
3285                                      "TEST_UNIT_READY failed (err_mask=0x%x)\n",
3286                                      err_mask);
3287                         return -EIO;
3288                 }
3289
3290                 if (!err_mask || sense_key != UNIT_ATTENTION)
3291                         return 0;
3292
3293                 err_mask = atapi_eh_request_sense(dev, sense_buffer, sense_key);
3294                 if (err_mask) {
3295                         ata_dev_warn(dev, "failed to clear "
3296                                 "UNIT ATTENTION (err_mask=0x%x)\n", err_mask);
3297                         return -EIO;
3298                 }
3299         }
3300
3301         ata_dev_warn(dev, "UNIT ATTENTION persists after %d tries\n",
3302                      ATA_EH_UA_TRIES);
3303
3304         return 0;
3305 }
3306
3307 /**
3308  *      ata_eh_maybe_retry_flush - Retry FLUSH if necessary
3309  *      @dev: ATA device which may need FLUSH retry
3310  *
3311  *      If @dev failed FLUSH, it needs to be reported upper layer
3312  *      immediately as it means that @dev failed to remap and already
3313  *      lost at least a sector and further FLUSH retrials won't make
3314  *      any difference to the lost sector.  However, if FLUSH failed
3315  *      for other reasons, for example transmission error, FLUSH needs
3316  *      to be retried.
3317  *
3318  *      This function determines whether FLUSH failure retry is
3319  *      necessary and performs it if so.
3320  *
3321  *      RETURNS:
3322  *      0 if EH can continue, -errno if EH needs to be repeated.
3323  */
3324 static int ata_eh_maybe_retry_flush(struct ata_device *dev)
3325 {
3326         struct ata_link *link = dev->link;
3327         struct ata_port *ap = link->ap;
3328         struct ata_queued_cmd *qc;
3329         struct ata_taskfile tf;
3330         unsigned int err_mask;
3331         int rc = 0;
3332
3333         /* did flush fail for this device? */
3334         if (!ata_tag_valid(link->active_tag))
3335                 return 0;
3336
3337         qc = __ata_qc_from_tag(ap, link->active_tag);
3338         if (qc->dev != dev || (qc->tf.command != ATA_CMD_FLUSH_EXT &&
3339                                qc->tf.command != ATA_CMD_FLUSH))
3340                 return 0;
3341
3342         /* if the device failed it, it should be reported to upper layers */
3343         if (qc->err_mask & AC_ERR_DEV)
3344                 return 0;
3345
3346         /* flush failed for some other reason, give it another shot */
3347         ata_tf_init(dev, &tf);
3348
3349         tf.command = qc->tf.command;
3350         tf.flags |= ATA_TFLAG_DEVICE;
3351         tf.protocol = ATA_PROT_NODATA;
3352
3353         ata_dev_warn(dev, "retrying FLUSH 0x%x Emask 0x%x\n",
3354                        tf.command, qc->err_mask);
3355
3356         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_NONE, NULL, 0, 0);
3357         if (!err_mask) {
3358                 /*
3359                  * FLUSH is complete but there's no way to
3360                  * successfully complete a failed command from EH.
3361                  * Making sure retry is allowed at least once and
3362                  * retrying it should do the trick - whatever was in
3363                  * the cache is already on the platter and this won't
3364                  * cause infinite loop.
3365                  */
3366                 qc->scsicmd->allowed = max(qc->scsicmd->allowed, 1);
3367         } else {
3368                 ata_dev_warn(dev, "FLUSH failed Emask 0x%x\n",
3369                                err_mask);
3370                 rc = -EIO;
3371
3372                 /* if device failed it, report it to upper layers */
3373                 if (err_mask & AC_ERR_DEV) {
3374                         qc->err_mask |= AC_ERR_DEV;
3375                         qc->result_tf = tf;
3376                         if (!(ap->pflags & ATA_PFLAG_FROZEN))
3377                                 rc = 0;
3378                 }
3379         }
3380         return rc;
3381 }
3382
3383 /**
3384  *      ata_eh_set_lpm - configure SATA interface power management
3385  *      @link: link to configure power management
3386  *      @policy: the link power management policy
3387  *      @r_failed_dev: out parameter for failed device
3388  *
3389  *      Enable SATA Interface power management.  This will enable
3390  *      Device Interface Power Management (DIPM) for min_power
3391  *      policy, and then call driver specific callbacks for
3392  *      enabling Host Initiated Power management.
3393  *
3394  *      LOCKING:
3395  *      EH context.
3396  *
3397  *      RETURNS:
3398  *      0 on success, -errno on failure.
3399  */
3400 static int ata_eh_set_lpm(struct ata_link *link, enum ata_lpm_policy policy,
3401                           struct ata_device **r_failed_dev)
3402 {
3403         struct ata_port *ap = ata_is_host_link(link) ? link->ap : NULL;
3404         struct ata_eh_context *ehc = &link->eh_context;
3405         struct ata_device *dev, *link_dev = NULL, *lpm_dev = NULL;
3406         enum ata_lpm_policy old_policy = link->lpm_policy;
3407         bool no_dipm = link->ap->flags & ATA_FLAG_NO_DIPM;
3408         unsigned int hints = ATA_LPM_EMPTY | ATA_LPM_HIPM;
3409         unsigned int err_mask;
3410         int rc;
3411
3412         /* if the link or host doesn't do LPM, noop */
3413         if ((link->flags & ATA_LFLAG_NO_LPM) || (ap && !ap->ops->set_lpm))
3414                 return 0;
3415
3416         /*
3417          * DIPM is enabled only for MIN_POWER as some devices
3418          * misbehave when the host NACKs transition to SLUMBER.  Order
3419          * device and link configurations such that the host always
3420          * allows DIPM requests.
3421          */
3422         ata_for_each_dev(dev, link, ENABLED) {
3423                 bool hipm = ata_id_has_hipm(dev->id);
3424                 bool dipm = ata_id_has_dipm(dev->id) && !no_dipm;
3425
3426                 /* find the first enabled and LPM enabled devices */
3427                 if (!link_dev)
3428                         link_dev = dev;
3429
3430                 if (!lpm_dev && (hipm || dipm))
3431                         lpm_dev = dev;
3432
3433                 hints &= ~ATA_LPM_EMPTY;
3434                 if (!hipm)
3435                         hints &= ~ATA_LPM_HIPM;
3436
3437                 /* disable DIPM before changing link config */
3438                 if (policy != ATA_LPM_MIN_POWER && dipm) {
3439                         err_mask = ata_dev_set_feature(dev,
3440                                         SETFEATURES_SATA_DISABLE, SATA_DIPM);
3441                         if (err_mask && err_mask != AC_ERR_DEV) {
3442                                 ata_dev_warn(dev,
3443                                              "failed to disable DIPM, Emask 0x%x\n",
3444                                              err_mask);
3445                                 rc = -EIO;
3446                                 goto fail;
3447                         }
3448                 }
3449         }
3450
3451         if (ap) {
3452                 rc = ap->ops->set_lpm(link, policy, hints);
3453                 if (!rc && ap->slave_link)
3454                         rc = ap->ops->set_lpm(ap->slave_link, policy, hints);
3455         } else
3456                 rc = sata_pmp_set_lpm(link, policy, hints);
3457
3458         /*
3459          * Attribute link config failure to the first (LPM) enabled
3460          * device on the link.
3461          */
3462         if (rc) {
3463                 if (rc == -EOPNOTSUPP) {
3464                         link->flags |= ATA_LFLAG_NO_LPM;
3465                         return 0;
3466                 }
3467                 dev = lpm_dev ? lpm_dev : link_dev;
3468                 goto fail;
3469         }
3470
3471         /*
3472          * Low level driver acked the transition.  Issue DIPM command
3473          * with the new policy set.
3474          */
3475         link->lpm_policy = policy;
3476         if (ap && ap->slave_link)
3477                 ap->slave_link->lpm_policy = policy;
3478
3479         /* host config updated, enable DIPM if transitioning to MIN_POWER */
3480         ata_for_each_dev(dev, link, ENABLED) {
3481                 if (policy == ATA_LPM_MIN_POWER && !no_dipm &&
3482                     ata_id_has_dipm(dev->id)) {
3483                         err_mask = ata_dev_set_feature(dev,
3484                                         SETFEATURES_SATA_ENABLE, SATA_DIPM);
3485                         if (err_mask && err_mask != AC_ERR_DEV) {
3486                                 ata_dev_warn(dev,
3487                                         "failed to enable DIPM, Emask 0x%x\n",
3488                                         err_mask);
3489                                 rc = -EIO;
3490                                 goto fail;
3491                         }
3492                 }
3493         }
3494
3495         return 0;
3496
3497 fail:
3498         /* restore the old policy */
3499         link->lpm_policy = old_policy;
3500         if (ap && ap->slave_link)
3501                 ap->slave_link->lpm_policy = old_policy;
3502
3503         /* if no device or only one more chance is left, disable LPM */
3504         if (!dev || ehc->tries[dev->devno] <= 2) {
3505                 ata_link_warn(link, "disabling LPM on the link\n");
3506                 link->flags |= ATA_LFLAG_NO_LPM;
3507         }
3508         if (r_failed_dev)
3509                 *r_failed_dev = dev;
3510         return rc;
3511 }
3512
3513 int ata_link_nr_enabled(struct ata_link *link)
3514 {
3515         struct ata_device *dev;
3516         int cnt = 0;
3517
3518         ata_for_each_dev(dev, link, ENABLED)
3519                 cnt++;
3520         return cnt;
3521 }
3522
3523 static int ata_link_nr_vacant(struct ata_link *link)
3524 {
3525         struct ata_device *dev;
3526         int cnt = 0;
3527
3528         ata_for_each_dev(dev, link, ALL)
3529                 if (dev->class == ATA_DEV_UNKNOWN)
3530                         cnt++;
3531         return cnt;
3532 }
3533
3534 static int ata_eh_skip_recovery(struct ata_link *link)
3535 {
3536         struct ata_port *ap = link->ap;
3537         struct ata_eh_context *ehc = &link->eh_context;
3538         struct ata_device *dev;
3539
3540         /* skip disabled links */
3541         if (link->flags & ATA_LFLAG_DISABLED)
3542                 return 1;
3543
3544         /* skip if explicitly requested */
3545         if (ehc->i.flags & ATA_EHI_NO_RECOVERY)
3546                 return 1;
3547
3548         /* thaw frozen port and recover failed devices */
3549         if ((ap->pflags & ATA_PFLAG_FROZEN) || ata_link_nr_enabled(link))
3550                 return 0;
3551
3552         /* reset at least once if reset is requested */
3553         if ((ehc->i.action & ATA_EH_RESET) &&
3554             !(ehc->i.flags & ATA_EHI_DID_RESET))
3555                 return 0;
3556
3557         /* skip if class codes for all vacant slots are ATA_DEV_NONE */
3558         ata_for_each_dev(dev, link, ALL) {
3559                 if (dev->class == ATA_DEV_UNKNOWN &&
3560                     ehc->classes[dev->devno] != ATA_DEV_NONE)
3561                         return 0;
3562         }
3563
3564         return 1;
3565 }
3566
3567 static int ata_count_probe_trials_cb(struct ata_ering_entry *ent, void *void_arg)
3568 {
3569         u64 interval = msecs_to_jiffies(ATA_EH_PROBE_TRIAL_INTERVAL);
3570         u64 now = get_jiffies_64();
3571         int *trials = void_arg;
3572
3573         if ((ent->eflags & ATA_EFLAG_OLD_ER) ||
3574             (ent->timestamp < now - min(now, interval)))
3575                 return -1;
3576
3577         (*trials)++;
3578         return 0;
3579 }
3580
3581 static int ata_eh_schedule_probe(struct ata_device *dev)
3582 {
3583         struct ata_eh_context *ehc = &dev->link->eh_context;
3584         struct ata_link *link = ata_dev_phys_link(dev);
3585         int trials = 0;
3586
3587         if (!(ehc->i.probe_mask & (1 << dev->devno)) ||
3588             (ehc->did_probe_mask & (1 << dev->devno)))
3589                 return 0;
3590
3591         ata_eh_detach_dev(dev);
3592         ata_dev_init(dev);
3593         ehc->did_probe_mask |= (1 << dev->devno);
3594         ehc->i.action |= ATA_EH_RESET;
3595         ehc->saved_xfer_mode[dev->devno] = 0;
3596         ehc->saved_ncq_enabled &= ~(1 << dev->devno);
3597
3598         /* the link maybe in a deep sleep, wake it up */
3599         if (link->lpm_policy > ATA_LPM_MAX_POWER) {
3600                 if (ata_is_host_link(link))
3601                         link->ap->ops->set_lpm(link, ATA_LPM_MAX_POWER,
3602                                                ATA_LPM_EMPTY);
3603                 else
3604                         sata_pmp_set_lpm(link, ATA_LPM_MAX_POWER,
3605                                          ATA_LPM_EMPTY);
3606         }
3607
3608         /* Record and count probe trials on the ering.  The specific
3609          * error mask used is irrelevant.  Because a successful device
3610          * detection clears the ering, this count accumulates only if
3611          * there are consecutive failed probes.
3612          *
3613          * If the count is equal to or higher than ATA_EH_PROBE_TRIALS
3614          * in the last ATA_EH_PROBE_TRIAL_INTERVAL, link speed is
3615          * forced to 1.5Gbps.
3616          *
3617          * This is to work around cases where failed link speed
3618          * negotiation results in device misdetection leading to
3619          * infinite DEVXCHG or PHRDY CHG events.
3620          */
3621         ata_ering_record(&dev->ering, 0, AC_ERR_OTHER);
3622         ata_ering_map(&dev->ering, ata_count_probe_trials_cb, &trials);
3623
3624         if (trials > ATA_EH_PROBE_TRIALS)
3625                 sata_down_spd_limit(link, 1);
3626
3627         return 1;
3628 }
3629
3630 static int ata_eh_handle_dev_fail(struct ata_device *dev, int err)
3631 {
3632         struct ata_eh_context *ehc = &dev->link->eh_context;
3633
3634         /* -EAGAIN from EH routine indicates retry without prejudice.
3635          * The requester is responsible for ensuring forward progress.
3636          */
3637         if (err != -EAGAIN)
3638                 ehc->tries[dev->devno]--;
3639
3640         switch (err) {
3641         case -ENODEV:
3642                 /* device missing or wrong IDENTIFY data, schedule probing */
3643                 ehc->i.probe_mask |= (1 << dev->devno);
3644         case -EINVAL:
3645                 /* give it just one more chance */
3646                 ehc->tries[dev->devno] = min(ehc->tries[dev->devno], 1);
3647         case -EIO:
3648                 if (ehc->tries[dev->devno] == 1) {
3649                         /* This is the last chance, better to slow
3650                          * down than lose it.
3651                          */
3652                         sata_down_spd_limit(ata_dev_phys_link(dev), 0);
3653                         if (dev->pio_mode > XFER_PIO_0)
3654                                 ata_down_xfermask_limit(dev, ATA_DNXFER_PIO);
3655                 }
3656         }
3657
3658         if (ata_dev_enabled(dev) && !ehc->tries[dev->devno]) {
3659                 /* disable device if it has used up all its chances */
3660                 ata_dev_disable(dev);
3661
3662                 /* detach if offline */
3663                 if (ata_phys_link_offline(ata_dev_phys_link(dev)))
3664                         ata_eh_detach_dev(dev);
3665
3666                 /* schedule probe if necessary */
3667                 if (ata_eh_schedule_probe(dev)) {
3668                         ehc->tries[dev->devno] = ATA_EH_DEV_TRIES;
3669                         memset(ehc->cmd_timeout_idx[dev->devno], 0,
3670                                sizeof(ehc->cmd_timeout_idx[dev->devno]));
3671                 }
3672
3673                 return 1;
3674         } else {
3675                 ehc->i.action |= ATA_EH_RESET;
3676                 return 0;
3677         }
3678 }
3679
3680 /**
3681  *      ata_eh_recover - recover host port after error
3682  *      @ap: host port to recover
3683  *      @prereset: prereset method (can be NULL)
3684  *      @softreset: softreset method (can be NULL)
3685  *      @hardreset: hardreset method (can be NULL)
3686  *      @postreset: postreset method (can be NULL)
3687  *      @r_failed_link: out parameter for failed link
3688  *
3689  *      This is the alpha and omega, eum and yang, heart and soul of
3690  *      libata exception handling.  On entry, actions required to
3691  *      recover each link and hotplug requests are recorded in the
3692  *      link's eh_context.  This function executes all the operations
3693  *      with appropriate retrials and fallbacks to resurrect failed
3694  *      devices, detach goners and greet newcomers.
3695  *
3696  *      LOCKING:
3697  *      Kernel thread context (may sleep).
3698  *
3699  *      RETURNS:
3700  *      0 on success, -errno on failure.
3701  */
3702 int ata_eh_recover(struct ata_port *ap, ata_prereset_fn_t prereset,
3703                    ata_reset_fn_t softreset, ata_reset_fn_t hardreset,
3704                    ata_postreset_fn_t postreset,
3705                    struct ata_link **r_failed_link)
3706 {
3707         struct ata_link *link;
3708         struct ata_device *dev;
3709         int rc, nr_fails;
3710         unsigned long flags, deadline;
3711
3712         DPRINTK("ENTER\n");
3713
3714         /* prep for recovery */
3715         ata_for_each_link(link, ap, EDGE) {
3716                 struct ata_eh_context *ehc = &link->eh_context;
3717
3718                 /* re-enable link? */
3719                 if (ehc->i.action & ATA_EH_ENABLE_LINK) {
3720                         ata_eh_about_to_do(link, NULL, ATA_EH_ENABLE_LINK);
3721                         spin_lock_irqsave(ap->lock, flags);
3722                         link->flags &= ~ATA_LFLAG_DISABLED;
3723                         spin_unlock_irqrestore(ap->lock, flags);
3724                         ata_eh_done(link, NULL, ATA_EH_ENABLE_LINK);
3725                 }
3726
3727                 ata_for_each_dev(dev, link, ALL) {
3728                         if (link->flags & ATA_LFLAG_NO_RETRY)
3729                                 ehc->tries[dev->devno] = 1;
3730                         else
3731                                 ehc->tries[dev->devno] = ATA_EH_DEV_TRIES;
3732
3733                         /* collect port action mask recorded in dev actions */
3734                         ehc->i.action |= ehc->i.dev_action[dev->devno] &
3735                                          ~ATA_EH_PERDEV_MASK;
3736                         ehc->i.dev_action[dev->devno] &= ATA_EH_PERDEV_MASK;
3737
3738                         /* process hotplug request */
3739                         if (dev->flags & ATA_DFLAG_DETACH)
3740                                 ata_eh_detach_dev(dev);
3741
3742                         /* schedule probe if necessary */
3743                         if (!ata_dev_enabled(dev))
3744                                 ata_eh_schedule_probe(dev);
3745                 }
3746         }
3747
3748  retry:
3749         rc = 0;
3750
3751         /* if UNLOADING, finish immediately */
3752         if (ap->pflags & ATA_PFLAG_UNLOADING)
3753                 goto out;
3754
3755         /* prep for EH */
3756         ata_for_each_link(link, ap, EDGE) {
3757                 struct ata_eh_context *ehc = &link->eh_context;
3758
3759                 /* skip EH if possible. */
3760                 if (ata_eh_skip_recovery(link))
3761                         ehc->i.action = 0;
3762
3763                 ata_for_each_dev(dev, link, ALL)
3764                         ehc->classes[dev->devno] = ATA_DEV_UNKNOWN;
3765         }
3766
3767         /* reset */
3768         ata_for_each_link(link, ap, EDGE) {
3769                 struct ata_eh_context *ehc = &link->eh_context;
3770
3771                 if (!(ehc->i.action & ATA_EH_RESET))
3772                         continue;
3773
3774                 rc = ata_eh_reset(link, ata_link_nr_vacant(link),
3775                                   prereset, softreset, hardreset, postreset);
3776                 if (rc) {
3777                         ata_link_err(link, "reset failed, giving up\n");
3778                         goto out;
3779                 }
3780         }
3781
3782         do {
3783                 unsigned long now;
3784
3785                 /*
3786                  * clears ATA_EH_PARK in eh_info and resets
3787                  * ap->park_req_pending
3788                  */
3789                 ata_eh_pull_park_action(ap);
3790
3791                 deadline = jiffies;
3792                 ata_for_each_link(link, ap, EDGE) {
3793                         ata_for_each_dev(dev, link, ALL) {
3794                                 struct ata_eh_context *ehc = &link->eh_context;
3795                                 unsigned long tmp;
3796
3797                                 if (dev->class != ATA_DEV_ATA &&
3798                                     dev->class != ATA_DEV_ZAC)
3799                                         continue;
3800                                 if (!(ehc->i.dev_action[dev->devno] &
3801                                       ATA_EH_PARK))
3802                                         continue;
3803                                 tmp = dev->unpark_deadline;
3804                                 if (time_before(deadline, tmp))
3805                                         deadline = tmp;
3806                                 else if (time_before_eq(tmp, jiffies))
3807                                         continue;
3808                                 if (ehc->unloaded_mask & (1 << dev->devno))
3809                                         continue;
3810
3811                                 ata_eh_park_issue_cmd(dev, 1);
3812                         }
3813                 }
3814
3815                 now = jiffies;
3816                 if (time_before_eq(deadline, now))
3817                         break;
3818
3819                 ata_eh_release(ap);
3820                 deadline = wait_for_completion_timeout(&ap->park_req_pending,
3821                                                        deadline - now);
3822                 ata_eh_acquire(ap);
3823         } while (deadline);
3824         ata_for_each_link(link, ap, EDGE) {
3825                 ata_for_each_dev(dev, link, ALL) {
3826                         if (!(link->eh_context.unloaded_mask &
3827                               (1 << dev->devno)))
3828                                 continue;
3829
3830                         ata_eh_park_issue_cmd(dev, 0);
3831                         ata_eh_done(link, dev, ATA_EH_PARK);
3832                 }
3833         }
3834
3835         /* the rest */
3836         nr_fails = 0;
3837         ata_for_each_link(link, ap, PMP_FIRST) {
3838                 struct ata_eh_context *ehc = &link->eh_context;
3839
3840                 if (sata_pmp_attached(ap) && ata_is_host_link(link))
3841                         goto config_lpm;
3842
3843                 /* revalidate existing devices and attach new ones */
3844                 rc = ata_eh_revalidate_and_attach(link, &dev);
3845                 if (rc)
3846                         goto rest_fail;
3847
3848                 /* if PMP got attached, return, pmp EH will take care of it */
3849                 if (link->device->class == ATA_DEV_PMP) {
3850                         ehc->i.action = 0;
3851                         return 0;
3852                 }
3853
3854                 /* configure transfer mode if necessary */
3855                 if (ehc->i.flags & ATA_EHI_SETMODE) {
3856                         rc = ata_set_mode(link, &dev);
3857                         if (rc)
3858                                 goto rest_fail;
3859                         ehc->i.flags &= ~ATA_EHI_SETMODE;
3860                 }
3861
3862                 /* If reset has been issued, clear UA to avoid
3863                  * disrupting the current users of the device.
3864                  */
3865                 if (ehc->i.flags & ATA_EHI_DID_RESET) {
3866                         ata_for_each_dev(dev, link, ALL) {
3867                                 if (dev->class != ATA_DEV_ATAPI)
3868                                         continue;
3869                                 rc = atapi_eh_clear_ua(dev);
3870                                 if (rc)
3871                                         goto rest_fail;
3872                                 if (zpodd_dev_enabled(dev))
3873                                         zpodd_post_poweron(dev);
3874                         }
3875                 }
3876
3877                 /* retry flush if necessary */
3878                 ata_for_each_dev(dev, link, ALL) {
3879                         if (dev->class != ATA_DEV_ATA &&
3880                             dev->class != ATA_DEV_ZAC)
3881                                 continue;
3882                         rc = ata_eh_maybe_retry_flush(dev);
3883                         if (rc)
3884                                 goto rest_fail;
3885                 }
3886
3887         config_lpm:
3888                 /* configure link power saving */
3889                 if (link->lpm_policy != ap->target_lpm_policy) {
3890                         rc = ata_eh_set_lpm(link, ap->target_lpm_policy, &dev);
3891                         if (rc)
3892                                 goto rest_fail;
3893                 }
3894
3895                 /* this link is okay now */
3896                 ehc->i.flags = 0;
3897                 continue;
3898
3899         rest_fail:
3900                 nr_fails++;
3901                 if (dev)
3902                         ata_eh_handle_dev_fail(dev, rc);
3903
3904                 if (ap->pflags & ATA_PFLAG_FROZEN) {
3905                         /* PMP reset requires working host port.
3906                          * Can't retry if it's frozen.
3907                          */
3908                         if (sata_pmp_attached(ap))
3909                                 goto out;
3910                         break;
3911                 }
3912         }
3913
3914         if (nr_fails)
3915                 goto retry;
3916
3917  out:
3918         if (rc && r_failed_link)
3919                 *r_failed_link = link;
3920
3921         DPRINTK("EXIT, rc=%d\n", rc);
3922         return rc;
3923 }
3924
3925 /**
3926  *      ata_eh_finish - finish up EH
3927  *      @ap: host port to finish EH for
3928  *
3929  *      Recovery is complete.  Clean up EH states and retry or finish
3930  *      failed qcs.
3931  *
3932  *      LOCKING:
3933  *      None.
3934  */
3935 void ata_eh_finish(struct ata_port *ap)
3936 {
3937         int tag;
3938
3939         /* retry or finish qcs */
3940         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
3941                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
3942
3943                 if (!(qc->flags & ATA_QCFLAG_FAILED))
3944                         continue;
3945
3946                 if (qc->err_mask) {
3947                         /* FIXME: Once EH migration is complete,
3948                          * generate sense data in this function,
3949                          * considering both err_mask and tf.
3950                          */
3951                         if (qc->flags & ATA_QCFLAG_RETRY)
3952                                 ata_eh_qc_retry(qc);
3953                         else
3954                                 ata_eh_qc_complete(qc);
3955                 } else {
3956                         if (qc->flags & ATA_QCFLAG_SENSE_VALID) {
3957                                 ata_eh_qc_complete(qc);
3958                         } else {
3959                                 /* feed zero TF to sense generation */
3960                                 memset(&qc->result_tf, 0, sizeof(qc->result_tf));
3961                                 ata_eh_qc_retry(qc);
3962                         }
3963                 }
3964         }
3965
3966         /* make sure nr_active_links is zero after EH */
3967         WARN_ON(ap->nr_active_links);
3968         ap->nr_active_links = 0;
3969 }
3970
3971 /**
3972  *      ata_do_eh - do standard error handling
3973  *      @ap: host port to handle error for
3974  *
3975  *      @prereset: prereset method (can be NULL)
3976  *      @softreset: softreset method (can be NULL)
3977  *      @hardreset: hardreset method (can be NULL)
3978  *      @postreset: postreset method (can be NULL)
3979  *
3980  *      Perform standard error handling sequence.
3981  *
3982  *      LOCKING:
3983  *      Kernel thread context (may sleep).
3984  */
3985 void ata_do_eh(struct ata_port *ap, ata_prereset_fn_t prereset,
3986                ata_reset_fn_t softreset, ata_reset_fn_t hardreset,
3987                ata_postreset_fn_t postreset)
3988 {
3989         struct ata_device *dev;
3990         int rc;
3991
3992         ata_eh_autopsy(ap);
3993         ata_eh_report(ap);
3994
3995         rc = ata_eh_recover(ap, prereset, softreset, hardreset, postreset,
3996                             NULL);
3997         if (rc) {
3998                 ata_for_each_dev(dev, &ap->link, ALL)
3999                         ata_dev_disable(dev);
4000         }
4001
4002         ata_eh_finish(ap);
4003 }
4004
4005 /**
4006  *      ata_std_error_handler - standard error handler
4007  *      @ap: host port to handle error for
4008  *
4009  *      Standard error handler
4010  *
4011  *      LOCKING:
4012  *      Kernel thread context (may sleep).
4013  */
4014 void ata_std_error_handler(struct ata_port *ap)
4015 {
4016         struct ata_port_operations *ops = ap->ops;
4017         ata_reset_fn_t hardreset = ops->hardreset;
4018
4019         /* ignore built-in hardreset if SCR access is not available */
4020         if (hardreset == sata_std_hardreset && !sata_scr_valid(&ap->link))
4021                 hardreset = NULL;
4022
4023         ata_do_eh(ap, ops->prereset, ops->softreset, hardreset, ops->postreset);
4024 }
4025
4026 #ifdef CONFIG_PM
4027 /**
4028  *      ata_eh_handle_port_suspend - perform port suspend operation
4029  *      @ap: port to suspend
4030  *
4031  *      Suspend @ap.
4032  *
4033  *      LOCKING:
4034  *      Kernel thread context (may sleep).
4035  */
4036 static void ata_eh_handle_port_suspend(struct ata_port *ap)
4037 {
4038         unsigned long flags;
4039         int rc = 0;
4040         struct ata_device *dev;
4041
4042         /* are we suspending? */
4043         spin_lock_irqsave(ap->lock, flags);
4044         if (!(ap->pflags & ATA_PFLAG_PM_PENDING) ||
4045             ap->pm_mesg.event & PM_EVENT_RESUME) {
4046                 spin_unlock_irqrestore(ap->lock, flags);
4047                 return;
4048         }
4049         spin_unlock_irqrestore(ap->lock, flags);
4050
4051         WARN_ON(ap->pflags & ATA_PFLAG_SUSPENDED);
4052
4053         /*
4054          * If we have a ZPODD attached, check its zero
4055          * power ready status before the port is frozen.
4056          * Only needed for runtime suspend.
4057          */
4058         if (PMSG_IS_AUTO(ap->pm_mesg)) {
4059                 ata_for_each_dev(dev, &ap->link, ENABLED) {
4060                         if (zpodd_dev_enabled(dev))
4061                                 zpodd_on_suspend(dev);
4062                 }
4063         }
4064
4065         /* tell ACPI we're suspending */
4066         rc = ata_acpi_on_suspend(ap);
4067         if (rc)
4068                 goto out;
4069
4070         /* suspend */
4071         ata_eh_freeze_port(ap);
4072
4073         if (ap->ops->port_suspend)
4074                 rc = ap->ops->port_suspend(ap, ap->pm_mesg);
4075
4076         ata_acpi_set_state(ap, ap->pm_mesg);
4077  out:
4078         /* update the flags */
4079         spin_lock_irqsave(ap->lock, flags);
4080
4081         ap->pflags &= ~ATA_PFLAG_PM_PENDING;
4082         if (rc == 0)
4083                 ap->pflags |= ATA_PFLAG_SUSPENDED;
4084         else if (ap->pflags & ATA_PFLAG_FROZEN)
4085                 ata_port_schedule_eh(ap);
4086
4087         spin_unlock_irqrestore(ap->lock, flags);
4088
4089         return;
4090 }
4091
4092 /**
4093  *      ata_eh_handle_port_resume - perform port resume operation
4094  *      @ap: port to resume
4095  *
4096  *      Resume @ap.
4097  *
4098  *      LOCKING:
4099  *      Kernel thread context (may sleep).
4100  */
4101 static void ata_eh_handle_port_resume(struct ata_port *ap)
4102 {
4103         struct ata_link *link;
4104         struct ata_device *dev;
4105         unsigned long flags;
4106         int rc = 0;
4107
4108         /* are we resuming? */
4109         spin_lock_irqsave(ap->lock, flags);
4110         if (!(ap->pflags & ATA_PFLAG_PM_PENDING) ||
4111             !(ap->pm_mesg.event & PM_EVENT_RESUME)) {
4112                 spin_unlock_irqrestore(ap->lock, flags);
4113                 return;
4114         }
4115         spin_unlock_irqrestore(ap->lock, flags);
4116
4117         WARN_ON(!(ap->pflags & ATA_PFLAG_SUSPENDED));
4118
4119         /*
4120          * Error timestamps are in jiffies which doesn't run while
4121          * suspended and PHY events during resume isn't too uncommon.
4122          * When the two are combined, it can lead to unnecessary speed
4123          * downs if the machine is suspended and resumed repeatedly.
4124          * Clear error history.
4125          */
4126         ata_for_each_link(link, ap, HOST_FIRST)
4127                 ata_for_each_dev(dev, link, ALL)
4128                         ata_ering_clear(&dev->ering);
4129
4130         ata_acpi_set_state(ap, ap->pm_mesg);
4131
4132         if (ap->ops->port_resume)
4133                 rc = ap->ops->port_resume(ap);
4134
4135         /* tell ACPI that we're resuming */
4136         ata_acpi_on_resume(ap);
4137
4138         /* update the flags */
4139         spin_lock_irqsave(ap->lock, flags);
4140         ap->pflags &= ~(ATA_PFLAG_PM_PENDING | ATA_PFLAG_SUSPENDED);
4141         spin_unlock_irqrestore(ap->lock, flags);
4142 }
4143 #endif /* CONFIG_PM */