kernfs: implement kernfs_root->supers list
[cascardo/linux.git] / fs / kernfs / dir.c
1 /*
2  * fs/kernfs/dir.c - kernfs directory implementation
3  *
4  * Copyright (c) 2001-3 Patrick Mochel
5  * Copyright (c) 2007 SUSE Linux Products GmbH
6  * Copyright (c) 2007, 2013 Tejun Heo <tj@kernel.org>
7  *
8  * This file is released under the GPLv2.
9  */
10
11 #include <linux/sched.h>
12 #include <linux/fs.h>
13 #include <linux/namei.h>
14 #include <linux/idr.h>
15 #include <linux/slab.h>
16 #include <linux/security.h>
17 #include <linux/hash.h>
18
19 #include "kernfs-internal.h"
20
21 DEFINE_MUTEX(kernfs_mutex);
22 static DEFINE_SPINLOCK(kernfs_rename_lock);     /* kn->parent and ->name */
23 static char kernfs_pr_cont_buf[PATH_MAX];       /* protected by rename_lock */
24
25 #define rb_to_kn(X) rb_entry((X), struct kernfs_node, rb)
26
27 static bool kernfs_active(struct kernfs_node *kn)
28 {
29         lockdep_assert_held(&kernfs_mutex);
30         return atomic_read(&kn->active) >= 0;
31 }
32
33 static bool kernfs_lockdep(struct kernfs_node *kn)
34 {
35 #ifdef CONFIG_DEBUG_LOCK_ALLOC
36         return kn->flags & KERNFS_LOCKDEP;
37 #else
38         return false;
39 #endif
40 }
41
42 static int kernfs_name_locked(struct kernfs_node *kn, char *buf, size_t buflen)
43 {
44         return strlcpy(buf, kn->parent ? kn->name : "/", buflen);
45 }
46
47 static char * __must_check kernfs_path_locked(struct kernfs_node *kn, char *buf,
48                                               size_t buflen)
49 {
50         char *p = buf + buflen;
51         int len;
52
53         *--p = '\0';
54
55         do {
56                 len = strlen(kn->name);
57                 if (p - buf < len + 1) {
58                         buf[0] = '\0';
59                         p = NULL;
60                         break;
61                 }
62                 p -= len;
63                 memcpy(p, kn->name, len);
64                 *--p = '/';
65                 kn = kn->parent;
66         } while (kn && kn->parent);
67
68         return p;
69 }
70
71 /**
72  * kernfs_name - obtain the name of a given node
73  * @kn: kernfs_node of interest
74  * @buf: buffer to copy @kn's name into
75  * @buflen: size of @buf
76  *
77  * Copies the name of @kn into @buf of @buflen bytes.  The behavior is
78  * similar to strlcpy().  It returns the length of @kn's name and if @buf
79  * isn't long enough, it's filled upto @buflen-1 and nul terminated.
80  *
81  * This function can be called from any context.
82  */
83 int kernfs_name(struct kernfs_node *kn, char *buf, size_t buflen)
84 {
85         unsigned long flags;
86         int ret;
87
88         spin_lock_irqsave(&kernfs_rename_lock, flags);
89         ret = kernfs_name_locked(kn, buf, buflen);
90         spin_unlock_irqrestore(&kernfs_rename_lock, flags);
91         return ret;
92 }
93
94 /**
95  * kernfs_path - build full path of a given node
96  * @kn: kernfs_node of interest
97  * @buf: buffer to copy @kn's name into
98  * @buflen: size of @buf
99  *
100  * Builds and returns the full path of @kn in @buf of @buflen bytes.  The
101  * path is built from the end of @buf so the returned pointer usually
102  * doesn't match @buf.  If @buf isn't long enough, @buf is nul terminated
103  * and %NULL is returned.
104  */
105 char *kernfs_path(struct kernfs_node *kn, char *buf, size_t buflen)
106 {
107         unsigned long flags;
108         char *p;
109
110         spin_lock_irqsave(&kernfs_rename_lock, flags);
111         p = kernfs_path_locked(kn, buf, buflen);
112         spin_unlock_irqrestore(&kernfs_rename_lock, flags);
113         return p;
114 }
115 EXPORT_SYMBOL_GPL(kernfs_path);
116
117 /**
118  * pr_cont_kernfs_name - pr_cont name of a kernfs_node
119  * @kn: kernfs_node of interest
120  *
121  * This function can be called from any context.
122  */
123 void pr_cont_kernfs_name(struct kernfs_node *kn)
124 {
125         unsigned long flags;
126
127         spin_lock_irqsave(&kernfs_rename_lock, flags);
128
129         kernfs_name_locked(kn, kernfs_pr_cont_buf, sizeof(kernfs_pr_cont_buf));
130         pr_cont("%s", kernfs_pr_cont_buf);
131
132         spin_unlock_irqrestore(&kernfs_rename_lock, flags);
133 }
134
135 /**
136  * pr_cont_kernfs_path - pr_cont path of a kernfs_node
137  * @kn: kernfs_node of interest
138  *
139  * This function can be called from any context.
140  */
141 void pr_cont_kernfs_path(struct kernfs_node *kn)
142 {
143         unsigned long flags;
144         char *p;
145
146         spin_lock_irqsave(&kernfs_rename_lock, flags);
147
148         p = kernfs_path_locked(kn, kernfs_pr_cont_buf,
149                                sizeof(kernfs_pr_cont_buf));
150         if (p)
151                 pr_cont("%s", p);
152         else
153                 pr_cont("<name too long>");
154
155         spin_unlock_irqrestore(&kernfs_rename_lock, flags);
156 }
157
158 /**
159  * kernfs_get_parent - determine the parent node and pin it
160  * @kn: kernfs_node of interest
161  *
162  * Determines @kn's parent, pins and returns it.  This function can be
163  * called from any context.
164  */
165 struct kernfs_node *kernfs_get_parent(struct kernfs_node *kn)
166 {
167         struct kernfs_node *parent;
168         unsigned long flags;
169
170         spin_lock_irqsave(&kernfs_rename_lock, flags);
171         parent = kn->parent;
172         kernfs_get(parent);
173         spin_unlock_irqrestore(&kernfs_rename_lock, flags);
174
175         return parent;
176 }
177
178 /**
179  *      kernfs_name_hash
180  *      @name: Null terminated string to hash
181  *      @ns:   Namespace tag to hash
182  *
183  *      Returns 31 bit hash of ns + name (so it fits in an off_t )
184  */
185 static unsigned int kernfs_name_hash(const char *name, const void *ns)
186 {
187         unsigned long hash = init_name_hash();
188         unsigned int len = strlen(name);
189         while (len--)
190                 hash = partial_name_hash(*name++, hash);
191         hash = (end_name_hash(hash) ^ hash_ptr((void *)ns, 31));
192         hash &= 0x7fffffffU;
193         /* Reserve hash numbers 0, 1 and INT_MAX for magic directory entries */
194         if (hash < 2)
195                 hash += 2;
196         if (hash >= INT_MAX)
197                 hash = INT_MAX - 1;
198         return hash;
199 }
200
201 static int kernfs_name_compare(unsigned int hash, const char *name,
202                                const void *ns, const struct kernfs_node *kn)
203 {
204         if (hash != kn->hash)
205                 return hash - kn->hash;
206         if (ns != kn->ns)
207                 return ns - kn->ns;
208         return strcmp(name, kn->name);
209 }
210
211 static int kernfs_sd_compare(const struct kernfs_node *left,
212                              const struct kernfs_node *right)
213 {
214         return kernfs_name_compare(left->hash, left->name, left->ns, right);
215 }
216
217 /**
218  *      kernfs_link_sibling - link kernfs_node into sibling rbtree
219  *      @kn: kernfs_node of interest
220  *
221  *      Link @kn into its sibling rbtree which starts from
222  *      @kn->parent->dir.children.
223  *
224  *      Locking:
225  *      mutex_lock(kernfs_mutex)
226  *
227  *      RETURNS:
228  *      0 on susccess -EEXIST on failure.
229  */
230 static int kernfs_link_sibling(struct kernfs_node *kn)
231 {
232         struct rb_node **node = &kn->parent->dir.children.rb_node;
233         struct rb_node *parent = NULL;
234
235         if (kernfs_type(kn) == KERNFS_DIR)
236                 kn->parent->dir.subdirs++;
237
238         while (*node) {
239                 struct kernfs_node *pos;
240                 int result;
241
242                 pos = rb_to_kn(*node);
243                 parent = *node;
244                 result = kernfs_sd_compare(kn, pos);
245                 if (result < 0)
246                         node = &pos->rb.rb_left;
247                 else if (result > 0)
248                         node = &pos->rb.rb_right;
249                 else
250                         return -EEXIST;
251         }
252         /* add new node and rebalance the tree */
253         rb_link_node(&kn->rb, parent, node);
254         rb_insert_color(&kn->rb, &kn->parent->dir.children);
255         return 0;
256 }
257
258 /**
259  *      kernfs_unlink_sibling - unlink kernfs_node from sibling rbtree
260  *      @kn: kernfs_node of interest
261  *
262  *      Try to unlink @kn from its sibling rbtree which starts from
263  *      kn->parent->dir.children.  Returns %true if @kn was actually
264  *      removed, %false if @kn wasn't on the rbtree.
265  *
266  *      Locking:
267  *      mutex_lock(kernfs_mutex)
268  */
269 static bool kernfs_unlink_sibling(struct kernfs_node *kn)
270 {
271         if (RB_EMPTY_NODE(&kn->rb))
272                 return false;
273
274         if (kernfs_type(kn) == KERNFS_DIR)
275                 kn->parent->dir.subdirs--;
276
277         rb_erase(&kn->rb, &kn->parent->dir.children);
278         RB_CLEAR_NODE(&kn->rb);
279         return true;
280 }
281
282 /**
283  *      kernfs_get_active - get an active reference to kernfs_node
284  *      @kn: kernfs_node to get an active reference to
285  *
286  *      Get an active reference of @kn.  This function is noop if @kn
287  *      is NULL.
288  *
289  *      RETURNS:
290  *      Pointer to @kn on success, NULL on failure.
291  */
292 struct kernfs_node *kernfs_get_active(struct kernfs_node *kn)
293 {
294         if (unlikely(!kn))
295                 return NULL;
296
297         if (!atomic_inc_unless_negative(&kn->active))
298                 return NULL;
299
300         if (kernfs_lockdep(kn))
301                 rwsem_acquire_read(&kn->dep_map, 0, 1, _RET_IP_);
302         return kn;
303 }
304
305 /**
306  *      kernfs_put_active - put an active reference to kernfs_node
307  *      @kn: kernfs_node to put an active reference to
308  *
309  *      Put an active reference to @kn.  This function is noop if @kn
310  *      is NULL.
311  */
312 void kernfs_put_active(struct kernfs_node *kn)
313 {
314         struct kernfs_root *root = kernfs_root(kn);
315         int v;
316
317         if (unlikely(!kn))
318                 return;
319
320         if (kernfs_lockdep(kn))
321                 rwsem_release(&kn->dep_map, 1, _RET_IP_);
322         v = atomic_dec_return(&kn->active);
323         if (likely(v != KN_DEACTIVATED_BIAS))
324                 return;
325
326         wake_up_all(&root->deactivate_waitq);
327 }
328
329 /**
330  * kernfs_drain - drain kernfs_node
331  * @kn: kernfs_node to drain
332  *
333  * Drain existing usages and nuke all existing mmaps of @kn.  Mutiple
334  * removers may invoke this function concurrently on @kn and all will
335  * return after draining is complete.
336  */
337 static void kernfs_drain(struct kernfs_node *kn)
338         __releases(&kernfs_mutex) __acquires(&kernfs_mutex)
339 {
340         struct kernfs_root *root = kernfs_root(kn);
341
342         lockdep_assert_held(&kernfs_mutex);
343         WARN_ON_ONCE(kernfs_active(kn));
344
345         mutex_unlock(&kernfs_mutex);
346
347         if (kernfs_lockdep(kn)) {
348                 rwsem_acquire(&kn->dep_map, 0, 0, _RET_IP_);
349                 if (atomic_read(&kn->active) != KN_DEACTIVATED_BIAS)
350                         lock_contended(&kn->dep_map, _RET_IP_);
351         }
352
353         /* but everyone should wait for draining */
354         wait_event(root->deactivate_waitq,
355                    atomic_read(&kn->active) == KN_DEACTIVATED_BIAS);
356
357         if (kernfs_lockdep(kn)) {
358                 lock_acquired(&kn->dep_map, _RET_IP_);
359                 rwsem_release(&kn->dep_map, 1, _RET_IP_);
360         }
361
362         kernfs_unmap_bin_file(kn);
363
364         mutex_lock(&kernfs_mutex);
365 }
366
367 /**
368  * kernfs_get - get a reference count on a kernfs_node
369  * @kn: the target kernfs_node
370  */
371 void kernfs_get(struct kernfs_node *kn)
372 {
373         if (kn) {
374                 WARN_ON(!atomic_read(&kn->count));
375                 atomic_inc(&kn->count);
376         }
377 }
378 EXPORT_SYMBOL_GPL(kernfs_get);
379
380 /**
381  * kernfs_put - put a reference count on a kernfs_node
382  * @kn: the target kernfs_node
383  *
384  * Put a reference count of @kn and destroy it if it reached zero.
385  */
386 void kernfs_put(struct kernfs_node *kn)
387 {
388         struct kernfs_node *parent;
389         struct kernfs_root *root;
390
391         if (!kn || !atomic_dec_and_test(&kn->count))
392                 return;
393         root = kernfs_root(kn);
394  repeat:
395         /*
396          * Moving/renaming is always done while holding reference.
397          * kn->parent won't change beneath us.
398          */
399         parent = kn->parent;
400
401         WARN_ONCE(atomic_read(&kn->active) != KN_DEACTIVATED_BIAS,
402                   "kernfs_put: %s/%s: released with incorrect active_ref %d\n",
403                   parent ? parent->name : "", kn->name, atomic_read(&kn->active));
404
405         if (kernfs_type(kn) == KERNFS_LINK)
406                 kernfs_put(kn->symlink.target_kn);
407         if (!(kn->flags & KERNFS_STATIC_NAME))
408                 kfree(kn->name);
409         if (kn->iattr) {
410                 if (kn->iattr->ia_secdata)
411                         security_release_secctx(kn->iattr->ia_secdata,
412                                                 kn->iattr->ia_secdata_len);
413                 simple_xattrs_free(&kn->iattr->xattrs);
414         }
415         kfree(kn->iattr);
416         ida_simple_remove(&root->ino_ida, kn->ino);
417         kmem_cache_free(kernfs_node_cache, kn);
418
419         kn = parent;
420         if (kn) {
421                 if (atomic_dec_and_test(&kn->count))
422                         goto repeat;
423         } else {
424                 /* just released the root kn, free @root too */
425                 ida_destroy(&root->ino_ida);
426                 kfree(root);
427         }
428 }
429 EXPORT_SYMBOL_GPL(kernfs_put);
430
431 static int kernfs_dop_revalidate(struct dentry *dentry, unsigned int flags)
432 {
433         struct kernfs_node *kn;
434
435         if (flags & LOOKUP_RCU)
436                 return -ECHILD;
437
438         /* Always perform fresh lookup for negatives */
439         if (!dentry->d_inode)
440                 goto out_bad_unlocked;
441
442         kn = dentry->d_fsdata;
443         mutex_lock(&kernfs_mutex);
444
445         /* The kernfs node has been deactivated */
446         if (!kernfs_active(kn))
447                 goto out_bad;
448
449         /* The kernfs node has been moved? */
450         if (dentry->d_parent->d_fsdata != kn->parent)
451                 goto out_bad;
452
453         /* The kernfs node has been renamed */
454         if (strcmp(dentry->d_name.name, kn->name) != 0)
455                 goto out_bad;
456
457         /* The kernfs node has been moved to a different namespace */
458         if (kn->parent && kernfs_ns_enabled(kn->parent) &&
459             kernfs_info(dentry->d_sb)->ns != kn->ns)
460                 goto out_bad;
461
462         mutex_unlock(&kernfs_mutex);
463 out_valid:
464         return 1;
465 out_bad:
466         mutex_unlock(&kernfs_mutex);
467 out_bad_unlocked:
468         /*
469          * @dentry doesn't match the underlying kernfs node, drop the
470          * dentry and force lookup.  If we have submounts we must allow the
471          * vfs caches to lie about the state of the filesystem to prevent
472          * leaks and other nasty things, so use check_submounts_and_drop()
473          * instead of d_drop().
474          */
475         if (check_submounts_and_drop(dentry) != 0)
476                 goto out_valid;
477
478         return 0;
479 }
480
481 static void kernfs_dop_release(struct dentry *dentry)
482 {
483         kernfs_put(dentry->d_fsdata);
484 }
485
486 const struct dentry_operations kernfs_dops = {
487         .d_revalidate   = kernfs_dop_revalidate,
488         .d_release      = kernfs_dop_release,
489 };
490
491 /**
492  * kernfs_node_from_dentry - determine kernfs_node associated with a dentry
493  * @dentry: the dentry in question
494  *
495  * Return the kernfs_node associated with @dentry.  If @dentry is not a
496  * kernfs one, %NULL is returned.
497  *
498  * While the returned kernfs_node will stay accessible as long as @dentry
499  * is accessible, the returned node can be in any state and the caller is
500  * fully responsible for determining what's accessible.
501  */
502 struct kernfs_node *kernfs_node_from_dentry(struct dentry *dentry)
503 {
504         if (dentry->d_sb->s_op == &kernfs_sops)
505                 return dentry->d_fsdata;
506         return NULL;
507 }
508
509 static struct kernfs_node *__kernfs_new_node(struct kernfs_root *root,
510                                              const char *name, umode_t mode,
511                                              unsigned flags)
512 {
513         char *dup_name = NULL;
514         struct kernfs_node *kn;
515         int ret;
516
517         if (!(flags & KERNFS_STATIC_NAME)) {
518                 name = dup_name = kstrdup(name, GFP_KERNEL);
519                 if (!name)
520                         return NULL;
521         }
522
523         kn = kmem_cache_zalloc(kernfs_node_cache, GFP_KERNEL);
524         if (!kn)
525                 goto err_out1;
526
527         ret = ida_simple_get(&root->ino_ida, 1, 0, GFP_KERNEL);
528         if (ret < 0)
529                 goto err_out2;
530         kn->ino = ret;
531
532         atomic_set(&kn->count, 1);
533         atomic_set(&kn->active, KN_DEACTIVATED_BIAS);
534         RB_CLEAR_NODE(&kn->rb);
535
536         kn->name = name;
537         kn->mode = mode;
538         kn->flags = flags;
539
540         return kn;
541
542  err_out2:
543         kmem_cache_free(kernfs_node_cache, kn);
544  err_out1:
545         kfree(dup_name);
546         return NULL;
547 }
548
549 struct kernfs_node *kernfs_new_node(struct kernfs_node *parent,
550                                     const char *name, umode_t mode,
551                                     unsigned flags)
552 {
553         struct kernfs_node *kn;
554
555         kn = __kernfs_new_node(kernfs_root(parent), name, mode, flags);
556         if (kn) {
557                 kernfs_get(parent);
558                 kn->parent = parent;
559         }
560         return kn;
561 }
562
563 /**
564  *      kernfs_add_one - add kernfs_node to parent without warning
565  *      @kn: kernfs_node to be added
566  *
567  *      The caller must already have initialized @kn->parent.  This
568  *      function increments nlink of the parent's inode if @kn is a
569  *      directory and link into the children list of the parent.
570  *
571  *      RETURNS:
572  *      0 on success, -EEXIST if entry with the given name already
573  *      exists.
574  */
575 int kernfs_add_one(struct kernfs_node *kn)
576 {
577         struct kernfs_node *parent = kn->parent;
578         struct kernfs_iattrs *ps_iattr;
579         bool has_ns;
580         int ret;
581
582         mutex_lock(&kernfs_mutex);
583
584         ret = -EINVAL;
585         has_ns = kernfs_ns_enabled(parent);
586         if (WARN(has_ns != (bool)kn->ns, KERN_WARNING "kernfs: ns %s in '%s' for '%s'\n",
587                  has_ns ? "required" : "invalid", parent->name, kn->name))
588                 goto out_unlock;
589
590         if (kernfs_type(parent) != KERNFS_DIR)
591                 goto out_unlock;
592
593         ret = -ENOENT;
594         if ((parent->flags & KERNFS_ACTIVATED) && !kernfs_active(parent))
595                 goto out_unlock;
596
597         kn->hash = kernfs_name_hash(kn->name, kn->ns);
598
599         ret = kernfs_link_sibling(kn);
600         if (ret)
601                 goto out_unlock;
602
603         /* Update timestamps on the parent */
604         ps_iattr = parent->iattr;
605         if (ps_iattr) {
606                 struct iattr *ps_iattrs = &ps_iattr->ia_iattr;
607                 ps_iattrs->ia_ctime = ps_iattrs->ia_mtime = CURRENT_TIME;
608         }
609
610         mutex_unlock(&kernfs_mutex);
611
612         /*
613          * Activate the new node unless CREATE_DEACTIVATED is requested.
614          * If not activated here, the kernfs user is responsible for
615          * activating the node with kernfs_activate().  A node which hasn't
616          * been activated is not visible to userland and its removal won't
617          * trigger deactivation.
618          */
619         if (!(kernfs_root(kn)->flags & KERNFS_ROOT_CREATE_DEACTIVATED))
620                 kernfs_activate(kn);
621         return 0;
622
623 out_unlock:
624         mutex_unlock(&kernfs_mutex);
625         return ret;
626 }
627
628 /**
629  * kernfs_find_ns - find kernfs_node with the given name
630  * @parent: kernfs_node to search under
631  * @name: name to look for
632  * @ns: the namespace tag to use
633  *
634  * Look for kernfs_node with name @name under @parent.  Returns pointer to
635  * the found kernfs_node on success, %NULL on failure.
636  */
637 static struct kernfs_node *kernfs_find_ns(struct kernfs_node *parent,
638                                           const unsigned char *name,
639                                           const void *ns)
640 {
641         struct rb_node *node = parent->dir.children.rb_node;
642         bool has_ns = kernfs_ns_enabled(parent);
643         unsigned int hash;
644
645         lockdep_assert_held(&kernfs_mutex);
646
647         if (has_ns != (bool)ns) {
648                 WARN(1, KERN_WARNING "kernfs: ns %s in '%s' for '%s'\n",
649                      has_ns ? "required" : "invalid", parent->name, name);
650                 return NULL;
651         }
652
653         hash = kernfs_name_hash(name, ns);
654         while (node) {
655                 struct kernfs_node *kn;
656                 int result;
657
658                 kn = rb_to_kn(node);
659                 result = kernfs_name_compare(hash, name, ns, kn);
660                 if (result < 0)
661                         node = node->rb_left;
662                 else if (result > 0)
663                         node = node->rb_right;
664                 else
665                         return kn;
666         }
667         return NULL;
668 }
669
670 /**
671  * kernfs_find_and_get_ns - find and get kernfs_node with the given name
672  * @parent: kernfs_node to search under
673  * @name: name to look for
674  * @ns: the namespace tag to use
675  *
676  * Look for kernfs_node with name @name under @parent and get a reference
677  * if found.  This function may sleep and returns pointer to the found
678  * kernfs_node on success, %NULL on failure.
679  */
680 struct kernfs_node *kernfs_find_and_get_ns(struct kernfs_node *parent,
681                                            const char *name, const void *ns)
682 {
683         struct kernfs_node *kn;
684
685         mutex_lock(&kernfs_mutex);
686         kn = kernfs_find_ns(parent, name, ns);
687         kernfs_get(kn);
688         mutex_unlock(&kernfs_mutex);
689
690         return kn;
691 }
692 EXPORT_SYMBOL_GPL(kernfs_find_and_get_ns);
693
694 /**
695  * kernfs_create_root - create a new kernfs hierarchy
696  * @scops: optional syscall operations for the hierarchy
697  * @flags: KERNFS_ROOT_* flags
698  * @priv: opaque data associated with the new directory
699  *
700  * Returns the root of the new hierarchy on success, ERR_PTR() value on
701  * failure.
702  */
703 struct kernfs_root *kernfs_create_root(struct kernfs_syscall_ops *scops,
704                                        unsigned int flags, void *priv)
705 {
706         struct kernfs_root *root;
707         struct kernfs_node *kn;
708
709         root = kzalloc(sizeof(*root), GFP_KERNEL);
710         if (!root)
711                 return ERR_PTR(-ENOMEM);
712
713         ida_init(&root->ino_ida);
714         INIT_LIST_HEAD(&root->supers);
715
716         kn = __kernfs_new_node(root, "", S_IFDIR | S_IRUGO | S_IXUGO,
717                                KERNFS_DIR);
718         if (!kn) {
719                 ida_destroy(&root->ino_ida);
720                 kfree(root);
721                 return ERR_PTR(-ENOMEM);
722         }
723
724         kn->priv = priv;
725         kn->dir.root = root;
726
727         root->syscall_ops = scops;
728         root->flags = flags;
729         root->kn = kn;
730         init_waitqueue_head(&root->deactivate_waitq);
731
732         if (!(root->flags & KERNFS_ROOT_CREATE_DEACTIVATED))
733                 kernfs_activate(kn);
734
735         return root;
736 }
737
738 /**
739  * kernfs_destroy_root - destroy a kernfs hierarchy
740  * @root: root of the hierarchy to destroy
741  *
742  * Destroy the hierarchy anchored at @root by removing all existing
743  * directories and destroying @root.
744  */
745 void kernfs_destroy_root(struct kernfs_root *root)
746 {
747         kernfs_remove(root->kn);        /* will also free @root */
748 }
749
750 /**
751  * kernfs_create_dir_ns - create a directory
752  * @parent: parent in which to create a new directory
753  * @name: name of the new directory
754  * @mode: mode of the new directory
755  * @priv: opaque data associated with the new directory
756  * @ns: optional namespace tag of the directory
757  *
758  * Returns the created node on success, ERR_PTR() value on failure.
759  */
760 struct kernfs_node *kernfs_create_dir_ns(struct kernfs_node *parent,
761                                          const char *name, umode_t mode,
762                                          void *priv, const void *ns)
763 {
764         struct kernfs_node *kn;
765         int rc;
766
767         /* allocate */
768         kn = kernfs_new_node(parent, name, mode | S_IFDIR, KERNFS_DIR);
769         if (!kn)
770                 return ERR_PTR(-ENOMEM);
771
772         kn->dir.root = parent->dir.root;
773         kn->ns = ns;
774         kn->priv = priv;
775
776         /* link in */
777         rc = kernfs_add_one(kn);
778         if (!rc)
779                 return kn;
780
781         kernfs_put(kn);
782         return ERR_PTR(rc);
783 }
784
785 static struct dentry *kernfs_iop_lookup(struct inode *dir,
786                                         struct dentry *dentry,
787                                         unsigned int flags)
788 {
789         struct dentry *ret;
790         struct kernfs_node *parent = dentry->d_parent->d_fsdata;
791         struct kernfs_node *kn;
792         struct inode *inode;
793         const void *ns = NULL;
794
795         mutex_lock(&kernfs_mutex);
796
797         if (kernfs_ns_enabled(parent))
798                 ns = kernfs_info(dir->i_sb)->ns;
799
800         kn = kernfs_find_ns(parent, dentry->d_name.name, ns);
801
802         /* no such entry */
803         if (!kn || !kernfs_active(kn)) {
804                 ret = NULL;
805                 goto out_unlock;
806         }
807         kernfs_get(kn);
808         dentry->d_fsdata = kn;
809
810         /* attach dentry and inode */
811         inode = kernfs_get_inode(dir->i_sb, kn);
812         if (!inode) {
813                 ret = ERR_PTR(-ENOMEM);
814                 goto out_unlock;
815         }
816
817         /* instantiate and hash dentry */
818         ret = d_materialise_unique(dentry, inode);
819  out_unlock:
820         mutex_unlock(&kernfs_mutex);
821         return ret;
822 }
823
824 static int kernfs_iop_mkdir(struct inode *dir, struct dentry *dentry,
825                             umode_t mode)
826 {
827         struct kernfs_node *parent = dir->i_private;
828         struct kernfs_syscall_ops *scops = kernfs_root(parent)->syscall_ops;
829         int ret;
830
831         if (!scops || !scops->mkdir)
832                 return -EPERM;
833
834         if (!kernfs_get_active(parent))
835                 return -ENODEV;
836
837         ret = scops->mkdir(parent, dentry->d_name.name, mode);
838
839         kernfs_put_active(parent);
840         return ret;
841 }
842
843 static int kernfs_iop_rmdir(struct inode *dir, struct dentry *dentry)
844 {
845         struct kernfs_node *kn  = dentry->d_fsdata;
846         struct kernfs_syscall_ops *scops = kernfs_root(kn)->syscall_ops;
847         int ret;
848
849         if (!scops || !scops->rmdir)
850                 return -EPERM;
851
852         if (!kernfs_get_active(kn))
853                 return -ENODEV;
854
855         ret = scops->rmdir(kn);
856
857         kernfs_put_active(kn);
858         return ret;
859 }
860
861 static int kernfs_iop_rename(struct inode *old_dir, struct dentry *old_dentry,
862                              struct inode *new_dir, struct dentry *new_dentry)
863 {
864         struct kernfs_node *kn  = old_dentry->d_fsdata;
865         struct kernfs_node *new_parent = new_dir->i_private;
866         struct kernfs_syscall_ops *scops = kernfs_root(kn)->syscall_ops;
867         int ret;
868
869         if (!scops || !scops->rename)
870                 return -EPERM;
871
872         if (!kernfs_get_active(kn))
873                 return -ENODEV;
874
875         if (!kernfs_get_active(new_parent)) {
876                 kernfs_put_active(kn);
877                 return -ENODEV;
878         }
879
880         ret = scops->rename(kn, new_parent, new_dentry->d_name.name);
881
882         kernfs_put_active(new_parent);
883         kernfs_put_active(kn);
884         return ret;
885 }
886
887 const struct inode_operations kernfs_dir_iops = {
888         .lookup         = kernfs_iop_lookup,
889         .permission     = kernfs_iop_permission,
890         .setattr        = kernfs_iop_setattr,
891         .getattr        = kernfs_iop_getattr,
892         .setxattr       = kernfs_iop_setxattr,
893         .removexattr    = kernfs_iop_removexattr,
894         .getxattr       = kernfs_iop_getxattr,
895         .listxattr      = kernfs_iop_listxattr,
896
897         .mkdir          = kernfs_iop_mkdir,
898         .rmdir          = kernfs_iop_rmdir,
899         .rename         = kernfs_iop_rename,
900 };
901
902 static struct kernfs_node *kernfs_leftmost_descendant(struct kernfs_node *pos)
903 {
904         struct kernfs_node *last;
905
906         while (true) {
907                 struct rb_node *rbn;
908
909                 last = pos;
910
911                 if (kernfs_type(pos) != KERNFS_DIR)
912                         break;
913
914                 rbn = rb_first(&pos->dir.children);
915                 if (!rbn)
916                         break;
917
918                 pos = rb_to_kn(rbn);
919         }
920
921         return last;
922 }
923
924 /**
925  * kernfs_next_descendant_post - find the next descendant for post-order walk
926  * @pos: the current position (%NULL to initiate traversal)
927  * @root: kernfs_node whose descendants to walk
928  *
929  * Find the next descendant to visit for post-order traversal of @root's
930  * descendants.  @root is included in the iteration and the last node to be
931  * visited.
932  */
933 static struct kernfs_node *kernfs_next_descendant_post(struct kernfs_node *pos,
934                                                        struct kernfs_node *root)
935 {
936         struct rb_node *rbn;
937
938         lockdep_assert_held(&kernfs_mutex);
939
940         /* if first iteration, visit leftmost descendant which may be root */
941         if (!pos)
942                 return kernfs_leftmost_descendant(root);
943
944         /* if we visited @root, we're done */
945         if (pos == root)
946                 return NULL;
947
948         /* if there's an unvisited sibling, visit its leftmost descendant */
949         rbn = rb_next(&pos->rb);
950         if (rbn)
951                 return kernfs_leftmost_descendant(rb_to_kn(rbn));
952
953         /* no sibling left, visit parent */
954         return pos->parent;
955 }
956
957 /**
958  * kernfs_activate - activate a node which started deactivated
959  * @kn: kernfs_node whose subtree is to be activated
960  *
961  * If the root has KERNFS_ROOT_CREATE_DEACTIVATED set, a newly created node
962  * needs to be explicitly activated.  A node which hasn't been activated
963  * isn't visible to userland and deactivation is skipped during its
964  * removal.  This is useful to construct atomic init sequences where
965  * creation of multiple nodes should either succeed or fail atomically.
966  *
967  * The caller is responsible for ensuring that this function is not called
968  * after kernfs_remove*() is invoked on @kn.
969  */
970 void kernfs_activate(struct kernfs_node *kn)
971 {
972         struct kernfs_node *pos;
973
974         mutex_lock(&kernfs_mutex);
975
976         pos = NULL;
977         while ((pos = kernfs_next_descendant_post(pos, kn))) {
978                 if (!pos || (pos->flags & KERNFS_ACTIVATED))
979                         continue;
980
981                 WARN_ON_ONCE(pos->parent && RB_EMPTY_NODE(&pos->rb));
982                 WARN_ON_ONCE(atomic_read(&pos->active) != KN_DEACTIVATED_BIAS);
983
984                 atomic_sub(KN_DEACTIVATED_BIAS, &pos->active);
985                 pos->flags |= KERNFS_ACTIVATED;
986         }
987
988         mutex_unlock(&kernfs_mutex);
989 }
990
991 static void __kernfs_remove(struct kernfs_node *kn)
992 {
993         struct kernfs_node *pos;
994
995         lockdep_assert_held(&kernfs_mutex);
996
997         /*
998          * Short-circuit if non-root @kn has already finished removal.
999          * This is for kernfs_remove_self() which plays with active ref
1000          * after removal.
1001          */
1002         if (!kn || (kn->parent && RB_EMPTY_NODE(&kn->rb)))
1003                 return;
1004
1005         pr_debug("kernfs %s: removing\n", kn->name);
1006
1007         /* prevent any new usage under @kn by deactivating all nodes */
1008         pos = NULL;
1009         while ((pos = kernfs_next_descendant_post(pos, kn)))
1010                 if (kernfs_active(pos))
1011                         atomic_add(KN_DEACTIVATED_BIAS, &pos->active);
1012
1013         /* deactivate and unlink the subtree node-by-node */
1014         do {
1015                 pos = kernfs_leftmost_descendant(kn);
1016
1017                 /*
1018                  * kernfs_drain() drops kernfs_mutex temporarily and @pos's
1019                  * base ref could have been put by someone else by the time
1020                  * the function returns.  Make sure it doesn't go away
1021                  * underneath us.
1022                  */
1023                 kernfs_get(pos);
1024
1025                 /*
1026                  * Drain iff @kn was activated.  This avoids draining and
1027                  * its lockdep annotations for nodes which have never been
1028                  * activated and allows embedding kernfs_remove() in create
1029                  * error paths without worrying about draining.
1030                  */
1031                 if (kn->flags & KERNFS_ACTIVATED)
1032                         kernfs_drain(pos);
1033                 else
1034                         WARN_ON_ONCE(atomic_read(&kn->active) != KN_DEACTIVATED_BIAS);
1035
1036                 /*
1037                  * kernfs_unlink_sibling() succeeds once per node.  Use it
1038                  * to decide who's responsible for cleanups.
1039                  */
1040                 if (!pos->parent || kernfs_unlink_sibling(pos)) {
1041                         struct kernfs_iattrs *ps_iattr =
1042                                 pos->parent ? pos->parent->iattr : NULL;
1043
1044                         /* update timestamps on the parent */
1045                         if (ps_iattr) {
1046                                 ps_iattr->ia_iattr.ia_ctime = CURRENT_TIME;
1047                                 ps_iattr->ia_iattr.ia_mtime = CURRENT_TIME;
1048                         }
1049
1050                         kernfs_put(pos);
1051                 }
1052
1053                 kernfs_put(pos);
1054         } while (pos != kn);
1055 }
1056
1057 /**
1058  * kernfs_remove - remove a kernfs_node recursively
1059  * @kn: the kernfs_node to remove
1060  *
1061  * Remove @kn along with all its subdirectories and files.
1062  */
1063 void kernfs_remove(struct kernfs_node *kn)
1064 {
1065         mutex_lock(&kernfs_mutex);
1066         __kernfs_remove(kn);
1067         mutex_unlock(&kernfs_mutex);
1068 }
1069
1070 /**
1071  * kernfs_break_active_protection - break out of active protection
1072  * @kn: the self kernfs_node
1073  *
1074  * The caller must be running off of a kernfs operation which is invoked
1075  * with an active reference - e.g. one of kernfs_ops.  Each invocation of
1076  * this function must also be matched with an invocation of
1077  * kernfs_unbreak_active_protection().
1078  *
1079  * This function releases the active reference of @kn the caller is
1080  * holding.  Once this function is called, @kn may be removed at any point
1081  * and the caller is solely responsible for ensuring that the objects it
1082  * dereferences are accessible.
1083  */
1084 void kernfs_break_active_protection(struct kernfs_node *kn)
1085 {
1086         /*
1087          * Take out ourself out of the active ref dependency chain.  If
1088          * we're called without an active ref, lockdep will complain.
1089          */
1090         kernfs_put_active(kn);
1091 }
1092
1093 /**
1094  * kernfs_unbreak_active_protection - undo kernfs_break_active_protection()
1095  * @kn: the self kernfs_node
1096  *
1097  * If kernfs_break_active_protection() was called, this function must be
1098  * invoked before finishing the kernfs operation.  Note that while this
1099  * function restores the active reference, it doesn't and can't actually
1100  * restore the active protection - @kn may already or be in the process of
1101  * being removed.  Once kernfs_break_active_protection() is invoked, that
1102  * protection is irreversibly gone for the kernfs operation instance.
1103  *
1104  * While this function may be called at any point after
1105  * kernfs_break_active_protection() is invoked, its most useful location
1106  * would be right before the enclosing kernfs operation returns.
1107  */
1108 void kernfs_unbreak_active_protection(struct kernfs_node *kn)
1109 {
1110         /*
1111          * @kn->active could be in any state; however, the increment we do
1112          * here will be undone as soon as the enclosing kernfs operation
1113          * finishes and this temporary bump can't break anything.  If @kn
1114          * is alive, nothing changes.  If @kn is being deactivated, the
1115          * soon-to-follow put will either finish deactivation or restore
1116          * deactivated state.  If @kn is already removed, the temporary
1117          * bump is guaranteed to be gone before @kn is released.
1118          */
1119         atomic_inc(&kn->active);
1120         if (kernfs_lockdep(kn))
1121                 rwsem_acquire(&kn->dep_map, 0, 1, _RET_IP_);
1122 }
1123
1124 /**
1125  * kernfs_remove_self - remove a kernfs_node from its own method
1126  * @kn: the self kernfs_node to remove
1127  *
1128  * The caller must be running off of a kernfs operation which is invoked
1129  * with an active reference - e.g. one of kernfs_ops.  This can be used to
1130  * implement a file operation which deletes itself.
1131  *
1132  * For example, the "delete" file for a sysfs device directory can be
1133  * implemented by invoking kernfs_remove_self() on the "delete" file
1134  * itself.  This function breaks the circular dependency of trying to
1135  * deactivate self while holding an active ref itself.  It isn't necessary
1136  * to modify the usual removal path to use kernfs_remove_self().  The
1137  * "delete" implementation can simply invoke kernfs_remove_self() on self
1138  * before proceeding with the usual removal path.  kernfs will ignore later
1139  * kernfs_remove() on self.
1140  *
1141  * kernfs_remove_self() can be called multiple times concurrently on the
1142  * same kernfs_node.  Only the first one actually performs removal and
1143  * returns %true.  All others will wait until the kernfs operation which
1144  * won self-removal finishes and return %false.  Note that the losers wait
1145  * for the completion of not only the winning kernfs_remove_self() but also
1146  * the whole kernfs_ops which won the arbitration.  This can be used to
1147  * guarantee, for example, all concurrent writes to a "delete" file to
1148  * finish only after the whole operation is complete.
1149  */
1150 bool kernfs_remove_self(struct kernfs_node *kn)
1151 {
1152         bool ret;
1153
1154         mutex_lock(&kernfs_mutex);
1155         kernfs_break_active_protection(kn);
1156
1157         /*
1158          * SUICIDAL is used to arbitrate among competing invocations.  Only
1159          * the first one will actually perform removal.  When the removal
1160          * is complete, SUICIDED is set and the active ref is restored
1161          * while holding kernfs_mutex.  The ones which lost arbitration
1162          * waits for SUICDED && drained which can happen only after the
1163          * enclosing kernfs operation which executed the winning instance
1164          * of kernfs_remove_self() finished.
1165          */
1166         if (!(kn->flags & KERNFS_SUICIDAL)) {
1167                 kn->flags |= KERNFS_SUICIDAL;
1168                 __kernfs_remove(kn);
1169                 kn->flags |= KERNFS_SUICIDED;
1170                 ret = true;
1171         } else {
1172                 wait_queue_head_t *waitq = &kernfs_root(kn)->deactivate_waitq;
1173                 DEFINE_WAIT(wait);
1174
1175                 while (true) {
1176                         prepare_to_wait(waitq, &wait, TASK_UNINTERRUPTIBLE);
1177
1178                         if ((kn->flags & KERNFS_SUICIDED) &&
1179                             atomic_read(&kn->active) == KN_DEACTIVATED_BIAS)
1180                                 break;
1181
1182                         mutex_unlock(&kernfs_mutex);
1183                         schedule();
1184                         mutex_lock(&kernfs_mutex);
1185                 }
1186                 finish_wait(waitq, &wait);
1187                 WARN_ON_ONCE(!RB_EMPTY_NODE(&kn->rb));
1188                 ret = false;
1189         }
1190
1191         /*
1192          * This must be done while holding kernfs_mutex; otherwise, waiting
1193          * for SUICIDED && deactivated could finish prematurely.
1194          */
1195         kernfs_unbreak_active_protection(kn);
1196
1197         mutex_unlock(&kernfs_mutex);
1198         return ret;
1199 }
1200
1201 /**
1202  * kernfs_remove_by_name_ns - find a kernfs_node by name and remove it
1203  * @parent: parent of the target
1204  * @name: name of the kernfs_node to remove
1205  * @ns: namespace tag of the kernfs_node to remove
1206  *
1207  * Look for the kernfs_node with @name and @ns under @parent and remove it.
1208  * Returns 0 on success, -ENOENT if such entry doesn't exist.
1209  */
1210 int kernfs_remove_by_name_ns(struct kernfs_node *parent, const char *name,
1211                              const void *ns)
1212 {
1213         struct kernfs_node *kn;
1214
1215         if (!parent) {
1216                 WARN(1, KERN_WARNING "kernfs: can not remove '%s', no directory\n",
1217                         name);
1218                 return -ENOENT;
1219         }
1220
1221         mutex_lock(&kernfs_mutex);
1222
1223         kn = kernfs_find_ns(parent, name, ns);
1224         if (kn)
1225                 __kernfs_remove(kn);
1226
1227         mutex_unlock(&kernfs_mutex);
1228
1229         if (kn)
1230                 return 0;
1231         else
1232                 return -ENOENT;
1233 }
1234
1235 /**
1236  * kernfs_rename_ns - move and rename a kernfs_node
1237  * @kn: target node
1238  * @new_parent: new parent to put @sd under
1239  * @new_name: new name
1240  * @new_ns: new namespace tag
1241  */
1242 int kernfs_rename_ns(struct kernfs_node *kn, struct kernfs_node *new_parent,
1243                      const char *new_name, const void *new_ns)
1244 {
1245         struct kernfs_node *old_parent;
1246         const char *old_name = NULL;
1247         int error;
1248
1249         /* can't move or rename root */
1250         if (!kn->parent)
1251                 return -EINVAL;
1252
1253         mutex_lock(&kernfs_mutex);
1254
1255         error = -ENOENT;
1256         if (!kernfs_active(kn) || !kernfs_active(new_parent))
1257                 goto out;
1258
1259         error = 0;
1260         if ((kn->parent == new_parent) && (kn->ns == new_ns) &&
1261             (strcmp(kn->name, new_name) == 0))
1262                 goto out;       /* nothing to rename */
1263
1264         error = -EEXIST;
1265         if (kernfs_find_ns(new_parent, new_name, new_ns))
1266                 goto out;
1267
1268         /* rename kernfs_node */
1269         if (strcmp(kn->name, new_name) != 0) {
1270                 error = -ENOMEM;
1271                 new_name = kstrdup(new_name, GFP_KERNEL);
1272                 if (!new_name)
1273                         goto out;
1274         } else {
1275                 new_name = NULL;
1276         }
1277
1278         /*
1279          * Move to the appropriate place in the appropriate directories rbtree.
1280          */
1281         kernfs_unlink_sibling(kn);
1282         kernfs_get(new_parent);
1283
1284         /* rename_lock protects ->parent and ->name accessors */
1285         spin_lock_irq(&kernfs_rename_lock);
1286
1287         old_parent = kn->parent;
1288         kn->parent = new_parent;
1289
1290         kn->ns = new_ns;
1291         if (new_name) {
1292                 if (!(kn->flags & KERNFS_STATIC_NAME))
1293                         old_name = kn->name;
1294                 kn->flags &= ~KERNFS_STATIC_NAME;
1295                 kn->name = new_name;
1296         }
1297
1298         spin_unlock_irq(&kernfs_rename_lock);
1299
1300         kn->hash = kernfs_name_hash(kn->name, kn->ns);
1301         kernfs_link_sibling(kn);
1302
1303         kernfs_put(old_parent);
1304         kfree(old_name);
1305
1306         error = 0;
1307  out:
1308         mutex_unlock(&kernfs_mutex);
1309         return error;
1310 }
1311
1312 /* Relationship between s_mode and the DT_xxx types */
1313 static inline unsigned char dt_type(struct kernfs_node *kn)
1314 {
1315         return (kn->mode >> 12) & 15;
1316 }
1317
1318 static int kernfs_dir_fop_release(struct inode *inode, struct file *filp)
1319 {
1320         kernfs_put(filp->private_data);
1321         return 0;
1322 }
1323
1324 static struct kernfs_node *kernfs_dir_pos(const void *ns,
1325         struct kernfs_node *parent, loff_t hash, struct kernfs_node *pos)
1326 {
1327         if (pos) {
1328                 int valid = kernfs_active(pos) &&
1329                         pos->parent == parent && hash == pos->hash;
1330                 kernfs_put(pos);
1331                 if (!valid)
1332                         pos = NULL;
1333         }
1334         if (!pos && (hash > 1) && (hash < INT_MAX)) {
1335                 struct rb_node *node = parent->dir.children.rb_node;
1336                 while (node) {
1337                         pos = rb_to_kn(node);
1338
1339                         if (hash < pos->hash)
1340                                 node = node->rb_left;
1341                         else if (hash > pos->hash)
1342                                 node = node->rb_right;
1343                         else
1344                                 break;
1345                 }
1346         }
1347         /* Skip over entries which are dying/dead or in the wrong namespace */
1348         while (pos && (!kernfs_active(pos) || pos->ns != ns)) {
1349                 struct rb_node *node = rb_next(&pos->rb);
1350                 if (!node)
1351                         pos = NULL;
1352                 else
1353                         pos = rb_to_kn(node);
1354         }
1355         return pos;
1356 }
1357
1358 static struct kernfs_node *kernfs_dir_next_pos(const void *ns,
1359         struct kernfs_node *parent, ino_t ino, struct kernfs_node *pos)
1360 {
1361         pos = kernfs_dir_pos(ns, parent, ino, pos);
1362         if (pos) {
1363                 do {
1364                         struct rb_node *node = rb_next(&pos->rb);
1365                         if (!node)
1366                                 pos = NULL;
1367                         else
1368                                 pos = rb_to_kn(node);
1369                 } while (pos && (!kernfs_active(pos) || pos->ns != ns));
1370         }
1371         return pos;
1372 }
1373
1374 static int kernfs_fop_readdir(struct file *file, struct dir_context *ctx)
1375 {
1376         struct dentry *dentry = file->f_path.dentry;
1377         struct kernfs_node *parent = dentry->d_fsdata;
1378         struct kernfs_node *pos = file->private_data;
1379         const void *ns = NULL;
1380
1381         if (!dir_emit_dots(file, ctx))
1382                 return 0;
1383         mutex_lock(&kernfs_mutex);
1384
1385         if (kernfs_ns_enabled(parent))
1386                 ns = kernfs_info(dentry->d_sb)->ns;
1387
1388         for (pos = kernfs_dir_pos(ns, parent, ctx->pos, pos);
1389              pos;
1390              pos = kernfs_dir_next_pos(ns, parent, ctx->pos, pos)) {
1391                 const char *name = pos->name;
1392                 unsigned int type = dt_type(pos);
1393                 int len = strlen(name);
1394                 ino_t ino = pos->ino;
1395
1396                 ctx->pos = pos->hash;
1397                 file->private_data = pos;
1398                 kernfs_get(pos);
1399
1400                 mutex_unlock(&kernfs_mutex);
1401                 if (!dir_emit(ctx, name, len, ino, type))
1402                         return 0;
1403                 mutex_lock(&kernfs_mutex);
1404         }
1405         mutex_unlock(&kernfs_mutex);
1406         file->private_data = NULL;
1407         ctx->pos = INT_MAX;
1408         return 0;
1409 }
1410
1411 static loff_t kernfs_dir_fop_llseek(struct file *file, loff_t offset,
1412                                     int whence)
1413 {
1414         struct inode *inode = file_inode(file);
1415         loff_t ret;
1416
1417         mutex_lock(&inode->i_mutex);
1418         ret = generic_file_llseek(file, offset, whence);
1419         mutex_unlock(&inode->i_mutex);
1420
1421         return ret;
1422 }
1423
1424 const struct file_operations kernfs_dir_fops = {
1425         .read           = generic_read_dir,
1426         .iterate        = kernfs_fop_readdir,
1427         .release        = kernfs_dir_fop_release,
1428         .llseek         = kernfs_dir_fop_llseek,
1429 };