igb: don't reuse pages with pfmemalloc flag
authorRoman Gushchin <klamm@yandex-team.ru>
Thu, 23 Oct 2014 03:32:27 +0000 (03:32 +0000)
committerJeff Kirsher <jeffrey.t.kirsher@intel.com>
Thu, 30 Oct 2014 11:56:52 +0000 (04:56 -0700)
commitbc16e47f03a7dce9ad68029b21519265c334eb12
treef8f434d6059d1809bd79ff13f9443fb374d25b15
parenta22bb0b9b9b09b4cc711f6d577679773e074dde9
igb: don't reuse pages with pfmemalloc flag

Incoming packet is dropped silently by sk_filter(), if the skb was
allocated from pfmemalloc reserves and the corresponding socket is
not marked with the SOCK_MEMALLOC flag.

Igb driver allocates pages for DMA with __skb_alloc_page(), which
calls alloc_pages_node() with the __GFP_MEMALLOC flag. So, in case
of OOM condition, igb can get pages with pfmemalloc flag set.

If an incoming packet hits the pfmemalloc page and is large enough
(small packets are copying into the memory, allocated with
netdev_alloc_skb_ip_align(), so they are not affected), it will be
dropped.

This behavior is ok under high memory pressure, but the problem is
that the igb driver reuses these mapped pages. So, packets are still
dropping even if all memory issues are gone and there is a plenty
of free memory.

In my case, some TCP sessions hang on a small percentage (< 0.1%)
of machines days after OOMs.

Fix this by avoiding reuse of such pages.

Signed-off-by: Roman Gushchin <klamm@yandex-team.ru>
Tested-by: Aaron Brown "aaron.f.brown@intel.com"
Signed-off-by: Jeff Kirsher <jeffrey.t.kirsher@intel.com>
drivers/net/ethernet/intel/igb/igb_main.c