Merge branch 'slab/next' of git://git.kernel.org/pub/scm/linux/kernel/git/penberg...

[cascardo/linux.git] / mm / slub.c
diff --git a/mm/slub.c b/mm/slub.c

index 591bf98..5e234f1 100644 (file)
--- a/mm/slub.c
+++ b/mm/slub.c
@@ -224,7 +224,11 @@ static inline void memcg_propagate_slab_attrs(struct kmem_cache *s) { }
  static inline void stat(const struct kmem_cache *s, enum stat_item si)
  {
  #ifdef CONFIG_SLUB_STATS
-       __this_cpu_inc(s->cpu_slab->stat[si]);
+       /*
+        * The rmw is racy on a preemptible kernel but this is acceptable, so
+        * avoid this_cpu_add()'s irq-disable overhead.
+        */
+       raw_cpu_inc(s->cpu_slab->stat[si]);
  #endif
  }
  
@@ -1004,21 +1008,19 @@ static inline void slab_free_hook(struct kmem_cache *s, void *x)
  static void add_full(struct kmem_cache *s,
         struct kmem_cache_node *n, struct page *page)
  {
-       lockdep_assert_held(&n->list_lock);
-
         if (!(s->flags & SLAB_STORE_USER))
                 return;
  
+       lockdep_assert_held(&n->list_lock);
         list_add(&page->lru, &n->full);
  }
  
  static void remove_full(struct kmem_cache *s, struct kmem_cache_node *n, struct page *page)
  {
-       lockdep_assert_held(&n->list_lock);
-
         if (!(s->flags & SLAB_STORE_USER))
                 return;
  
+       lockdep_assert_held(&n->list_lock);
         list_del(&page->lru);
  }
  
@@ -1521,11 +1523,9 @@ static void discard_slab(struct kmem_cache *s, struct page *page)
  /*
   * Management of partially allocated slabs.
   */
-static inline void add_partial(struct kmem_cache_node *n,
-                               struct page *page, int tail)
+static inline void
+__add_partial(struct kmem_cache_node *n, struct page *page, int tail)
  {
-       lockdep_assert_held(&n->list_lock);
-
         n->nr_partial++;
         if (tail == DEACTIVATE_TO_TAIL)
                 list_add_tail(&page->lru, &n->partial);
@@ -1533,15 +1533,27 @@ static inline void add_partial(struct kmem_cache_node *n,
                 list_add(&page->lru, &n->partial);
  }
  
-static inline void remove_partial(struct kmem_cache_node *n,
-                                       struct page *page)
+static inline void add_partial(struct kmem_cache_node *n,
+                               struct page *page, int tail)
  {
         lockdep_assert_held(&n->list_lock);
+       __add_partial(n, page, tail);
+}
  
+static inline void
+__remove_partial(struct kmem_cache_node *n, struct page *page)
+{
         list_del(&page->lru);
         n->nr_partial--;
  }
  
+static inline void remove_partial(struct kmem_cache_node *n,
+                                       struct page *page)
+{
+       lockdep_assert_held(&n->list_lock);
+       __remove_partial(n, page);
+}
+
  /*
   * Remove slab from the partial list, freeze it and
   * return the pointer to the freelist.
@@ -1677,8 +1689,8 @@ static void *get_any_partial(struct kmem_cache *s, gfp_t flags,
                 return NULL;
  
         do {
-               cpuset_mems_cookie = get_mems_allowed();
-               zonelist = node_zonelist(slab_node(), flags);
+               cpuset_mems_cookie = read_mems_allowed_begin();
+               zonelist = node_zonelist(mempolicy_slab_node(), flags);
                 for_each_zone_zonelist(zone, z, zonelist, high_zoneidx) {
                         struct kmem_cache_node *n;
  
@@ -1689,19 +1701,17 @@ static void *get_any_partial(struct kmem_cache *s, gfp_t flags,
                                 object = get_partial_node(s, n, c, flags);
                                 if (object) {
                                         /*
-                                        * Return the object even if
-                                        * put_mems_allowed indicated that
-                                        * the cpuset mems_allowed was
-                                        * updated in parallel. It's a
-                                        * harmless race between the alloc
-                                        * and the cpuset update.
+                                        * Don't check read_mems_allowed_retry()
+                                        * here - if mems_allowed was updated in
+                                        * parallel, that was a harmless race
+                                        * between allocation and the cpuset
+                                        * update
                                          */
-                                       put_mems_allowed(cpuset_mems_cookie);
                                         return object;
                                 }
                         }
                 }
-       } while (!put_mems_allowed(cpuset_mems_cookie));
+       } while (read_mems_allowed_retry(cpuset_mems_cookie));
  #endif
         return NULL;
  }
@@ -2907,12 +2917,10 @@ static void early_kmem_cache_node_alloc(int node)
         inc_slabs_node(kmem_cache_node, node, page->objects);
  
         /*
-        * the lock is for lockdep's sake, not for any actual
-        * race protection
+        * No locks need to be taken here as it has just been
+        * initialized and there is no concurrent access.
          */
-       spin_lock(&n->list_lock);
-       add_partial(n, page, DEACTIVATE_TO_HEAD);
-       spin_unlock(&n->list_lock);
+       __add_partial(n, page, DEACTIVATE_TO_HEAD);
  }
  
  static void free_kmem_cache_nodes(struct kmem_cache *s)
@@ -3198,7 +3206,7 @@ static void free_partial(struct kmem_cache *s, struct kmem_cache_node *n)
  
         list_for_each_entry_safe(page, h, &n->partial, lru) {
                 if (!page->inuse) {
-                       remove_partial(n, page);
+                       __remove_partial(n, page);
                         discard_slab(s, page);
                 } else {
                         list_slab_objects(s, page,
@@ -3234,8 +3242,9 @@ int __kmem_cache_shutdown(struct kmem_cache *s)
  
         if (!rc) {
                 /*
-                * We do the same lock strategy around sysfs_slab_add, see
-                * __kmem_cache_create. Because this is pretty much the last
+                * Since slab_attr_store may take the slab_mutex, we should
+                * release the lock while removing the sysfs entry in order to
+                * avoid a deadlock. Because this is pretty much the last
                  * operation we do and the lock will be released shortly after
                  * that in slab_common.c, we could just move sysfs_slab_remove
                  * to a later point in common code. We should do that when we
@@ -3681,6 +3690,9 @@ static int slab_unmergeable(struct kmem_cache *s)
         if (slub_nomerge || (s->flags & SLUB_NEVER_MERGE))
                 return 1;
  
+       if (!is_root_cache(s))
+               return 1;
+
         if (s->ctor)
                 return 1;
  
@@ -3693,9 +3705,8 @@ static int slab_unmergeable(struct kmem_cache *s)
         return 0;
  }
  
-static struct kmem_cache *find_mergeable(struct mem_cgroup *memcg, size_t size,
-               size_t align, unsigned long flags, const char *name,
-               void (*ctor)(void *))
+static struct kmem_cache *find_mergeable(size_t size, size_t align,
+               unsigned long flags, const char *name, void (*ctor)(void *))
  {
         struct kmem_cache *s;
  
@@ -3718,7 +3729,7 @@ static struct kmem_cache *find_mergeable(struct mem_cgroup *memcg, size_t size,
                         continue;
  
                 if ((flags & SLUB_MERGE_SAME) != (s->flags & SLUB_MERGE_SAME))
-                               continue;
+                       continue;
                 /*
                  * Check if alignment is compatible.
                  * Courtesy of Adrian Drzewiecki
@@ -3729,23 +3740,24 @@ static struct kmem_cache *find_mergeable(struct mem_cgroup *memcg, size_t size,
                 if (s->size - size >= sizeof(void *))
                         continue;
  
-               if (!cache_match_memcg(s, memcg))
-                       continue;
-
                 return s;
         }
         return NULL;
  }
  
  struct kmem_cache *
-__kmem_cache_alias(struct mem_cgroup *memcg, const char *name, size_t size,
-                  size_t align, unsigned long flags, void (*ctor)(void *))
+__kmem_cache_alias(const char *name, size_t size, size_t align,
+                  unsigned long flags, void (*ctor)(void *))
  {
         struct kmem_cache *s;
  
-       s = find_mergeable(memcg, size, align, flags, name, ctor);
+       s = find_mergeable(size, align, flags, name, ctor);
         if (s) {
+               int i;
+               struct kmem_cache *c;
+
                 s->refcount++;
+
                 /*
                  * Adjust the object sizes so that we clear
                  * the complete object on kzalloc.
@@ -3753,6 +3765,15 @@ __kmem_cache_alias(struct mem_cgroup *memcg, const char *name, size_t size,
                 s->object_size = max(s->object_size, (int)size);
                 s->inuse = max_t(int, s->inuse, ALIGN(size, sizeof(void *)));
  
+               for_each_memcg_cache_index(i) {
+                       c = cache_from_memcg_idx(s, i);
+                       if (!c)
+                               continue;
+                       c->object_size = s->object_size;
+                       c->inuse = max_t(int, c->inuse,
+                                        ALIGN(size, sizeof(void *)));
+               }
+
                 if (sysfs_slab_alias(s, name)) {
                         s->refcount--;
                         s = NULL;
@@ -3775,10 +3796,7 @@ int __kmem_cache_create(struct kmem_cache *s, unsigned long flags)
                 return 0;
  
         memcg_propagate_slab_attrs(s);
-       mutex_unlock(&slab_mutex);
         err = sysfs_slab_add(s);
-       mutex_lock(&slab_mutex);
-
         if (err)
                 kmem_cache_close(s);
  
@@ -5125,6 +5143,15 @@ static const struct kset_uevent_ops slab_uevent_ops = {
  
  static struct kset *slab_kset;
  
+static inline struct kset *cache_kset(struct kmem_cache *s)
+{
+#ifdef CONFIG_MEMCG_KMEM
+       if (!is_root_cache(s))
+               return s->memcg_params->root_cache->memcg_kset;
+#endif
+       return slab_kset;
+}
+
  #define ID_STR_LENGTH 64
  
  /* Create a unique string id for a slab cache:
@@ -5190,26 +5217,39 @@ static int sysfs_slab_add(struct kmem_cache *s)
                 name = create_unique_id(s);
         }
  
-       s->kobj.kset = slab_kset;
+       s->kobj.kset = cache_kset(s);
         err = kobject_init_and_add(&s->kobj, &slab_ktype, NULL, "%s", name);
-       if (err) {
-               kobject_put(&s->kobj);
-               return err;
-       }
+       if (err)
+               goto out_put_kobj;
  
         err = sysfs_create_group(&s->kobj, &slab_attr_group);
-       if (err) {
-               kobject_del(&s->kobj);
-               kobject_put(&s->kobj);
-               return err;
+       if (err)
+               goto out_del_kobj;
+
+#ifdef CONFIG_MEMCG_KMEM
+       if (is_root_cache(s)) {
+               s->memcg_kset = kset_create_and_add("cgroup", NULL, &s->kobj);
+               if (!s->memcg_kset) {
+                       err = -ENOMEM;
+                       goto out_del_kobj;
+               }
         }
+#endif
+
         kobject_uevent(&s->kobj, KOBJ_ADD);
         if (!unmergeable) {
                 /* Setup first alias */
                 sysfs_slab_alias(s, s->name);
-               kfree(name);
         }
-       return 0;
+out:
+       if (!unmergeable)
+               kfree(name);
+       return err;
+out_del_kobj:
+       kobject_del(&s->kobj);
+out_put_kobj:
+       kobject_put(&s->kobj);
+       goto out;
  }
  
  static void sysfs_slab_remove(struct kmem_cache *s)
@@ -5221,6 +5261,9 @@ static void sysfs_slab_remove(struct kmem_cache *s)
                  */
                 return;
  
+#ifdef CONFIG_MEMCG_KMEM
+       kset_unregister(s->memcg_kset);
+#endif
         kobject_uevent(&s->kobj, KOBJ_REMOVE);
         kobject_del(&s->kobj);
         kobject_put(&s->kobj);