Merge branch 'nfs-for-2.6.37' of git://git.linux-nfs.org/projects/trondmy/nfs-2.6
[cascardo/linux.git] / fs / nfs / inode.c
1 /*
2  *  linux/fs/nfs/inode.c
3  *
4  *  Copyright (C) 1992  Rick Sladkey
5  *
6  *  nfs inode and superblock handling functions
7  *
8  *  Modularised by Alan Cox <alan@lxorguk.ukuu.org.uk>, while hacking some
9  *  experimental NFS changes. Modularisation taken straight from SYS5 fs.
10  *
11  *  Change to nfs_read_super() to permit NFS mounts to multi-homed hosts.
12  *  J.S.Peatfield@damtp.cam.ac.uk
13  *
14  */
15
16 #include <linux/module.h>
17 #include <linux/init.h>
18 #include <linux/sched.h>
19 #include <linux/time.h>
20 #include <linux/kernel.h>
21 #include <linux/mm.h>
22 #include <linux/string.h>
23 #include <linux/stat.h>
24 #include <linux/errno.h>
25 #include <linux/unistd.h>
26 #include <linux/sunrpc/clnt.h>
27 #include <linux/sunrpc/stats.h>
28 #include <linux/sunrpc/metrics.h>
29 #include <linux/nfs_fs.h>
30 #include <linux/nfs_mount.h>
31 #include <linux/nfs4_mount.h>
32 #include <linux/lockd/bind.h>
33 #include <linux/seq_file.h>
34 #include <linux/mount.h>
35 #include <linux/nfs_idmap.h>
36 #include <linux/vfs.h>
37 #include <linux/inet.h>
38 #include <linux/nfs_xdr.h>
39 #include <linux/slab.h>
40
41 #include <asm/system.h>
42 #include <asm/uaccess.h>
43
44 #include "nfs4_fs.h"
45 #include "callback.h"
46 #include "delegation.h"
47 #include "iostat.h"
48 #include "internal.h"
49 #include "fscache.h"
50 #include "dns_resolve.h"
51
52 #define NFSDBG_FACILITY         NFSDBG_VFS
53
54 #define NFS_64_BIT_INODE_NUMBERS_ENABLED        1
55
56 /* Default is to see 64-bit inode numbers */
57 static int enable_ino64 = NFS_64_BIT_INODE_NUMBERS_ENABLED;
58
59 static void nfs_invalidate_inode(struct inode *);
60 static int nfs_update_inode(struct inode *, struct nfs_fattr *);
61
62 static struct kmem_cache * nfs_inode_cachep;
63
64 static inline unsigned long
65 nfs_fattr_to_ino_t(struct nfs_fattr *fattr)
66 {
67         return nfs_fileid_to_ino_t(fattr->fileid);
68 }
69
70 /**
71  * nfs_wait_bit_killable - helper for functions that are sleeping on bit locks
72  * @word: long word containing the bit lock
73  */
74 int nfs_wait_bit_killable(void *word)
75 {
76         if (fatal_signal_pending(current))
77                 return -ERESTARTSYS;
78         schedule();
79         return 0;
80 }
81
82 /**
83  * nfs_compat_user_ino64 - returns the user-visible inode number
84  * @fileid: 64-bit fileid
85  *
86  * This function returns a 32-bit inode number if the boot parameter
87  * nfs.enable_ino64 is zero.
88  */
89 u64 nfs_compat_user_ino64(u64 fileid)
90 {
91         int ino;
92
93         if (enable_ino64)
94                 return fileid;
95         ino = fileid;
96         if (sizeof(ino) < sizeof(fileid))
97                 ino ^= fileid >> (sizeof(fileid)-sizeof(ino)) * 8;
98         return ino;
99 }
100
101 static void nfs_clear_inode(struct inode *inode)
102 {
103         /*
104          * The following should never happen...
105          */
106         BUG_ON(nfs_have_writebacks(inode));
107         BUG_ON(!list_empty(&NFS_I(inode)->open_files));
108         nfs_zap_acl_cache(inode);
109         nfs_access_zap_cache(inode);
110         nfs_fscache_release_inode_cookie(inode);
111 }
112
113 void nfs_evict_inode(struct inode *inode)
114 {
115         truncate_inode_pages(&inode->i_data, 0);
116         end_writeback(inode);
117         nfs_clear_inode(inode);
118 }
119
120 /**
121  * nfs_sync_mapping - helper to flush all mmapped dirty data to disk
122  */
123 int nfs_sync_mapping(struct address_space *mapping)
124 {
125         int ret = 0;
126
127         if (mapping->nrpages != 0) {
128                 unmap_mapping_range(mapping, 0, 0, 0);
129                 ret = nfs_wb_all(mapping->host);
130         }
131         return ret;
132 }
133
134 /*
135  * Invalidate the local caches
136  */
137 static void nfs_zap_caches_locked(struct inode *inode)
138 {
139         struct nfs_inode *nfsi = NFS_I(inode);
140         int mode = inode->i_mode;
141
142         nfs_inc_stats(inode, NFSIOS_ATTRINVALIDATE);
143
144         nfsi->attrtimeo = NFS_MINATTRTIMEO(inode);
145         nfsi->attrtimeo_timestamp = jiffies;
146
147         memset(NFS_COOKIEVERF(inode), 0, sizeof(NFS_COOKIEVERF(inode)));
148         if (S_ISREG(mode) || S_ISDIR(mode) || S_ISLNK(mode))
149                 nfsi->cache_validity |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_DATA|NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL|NFS_INO_REVAL_PAGECACHE;
150         else
151                 nfsi->cache_validity |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL|NFS_INO_REVAL_PAGECACHE;
152 }
153
154 void nfs_zap_caches(struct inode *inode)
155 {
156         spin_lock(&inode->i_lock);
157         nfs_zap_caches_locked(inode);
158         spin_unlock(&inode->i_lock);
159 }
160
161 void nfs_zap_mapping(struct inode *inode, struct address_space *mapping)
162 {
163         if (mapping->nrpages != 0) {
164                 spin_lock(&inode->i_lock);
165                 NFS_I(inode)->cache_validity |= NFS_INO_INVALID_DATA;
166                 spin_unlock(&inode->i_lock);
167         }
168 }
169
170 void nfs_zap_acl_cache(struct inode *inode)
171 {
172         void (*clear_acl_cache)(struct inode *);
173
174         clear_acl_cache = NFS_PROTO(inode)->clear_acl_cache;
175         if (clear_acl_cache != NULL)
176                 clear_acl_cache(inode);
177         spin_lock(&inode->i_lock);
178         NFS_I(inode)->cache_validity &= ~NFS_INO_INVALID_ACL;
179         spin_unlock(&inode->i_lock);
180 }
181
182 void nfs_invalidate_atime(struct inode *inode)
183 {
184         spin_lock(&inode->i_lock);
185         NFS_I(inode)->cache_validity |= NFS_INO_INVALID_ATIME;
186         spin_unlock(&inode->i_lock);
187 }
188
189 /*
190  * Invalidate, but do not unhash, the inode.
191  * NB: must be called with inode->i_lock held!
192  */
193 static void nfs_invalidate_inode(struct inode *inode)
194 {
195         set_bit(NFS_INO_STALE, &NFS_I(inode)->flags);
196         nfs_zap_caches_locked(inode);
197 }
198
199 struct nfs_find_desc {
200         struct nfs_fh           *fh;
201         struct nfs_fattr        *fattr;
202 };
203
204 /*
205  * In NFSv3 we can have 64bit inode numbers. In order to support
206  * this, and re-exported directories (also seen in NFSv2)
207  * we are forced to allow 2 different inodes to have the same
208  * i_ino.
209  */
210 static int
211 nfs_find_actor(struct inode *inode, void *opaque)
212 {
213         struct nfs_find_desc    *desc = (struct nfs_find_desc *)opaque;
214         struct nfs_fh           *fh = desc->fh;
215         struct nfs_fattr        *fattr = desc->fattr;
216
217         if (NFS_FILEID(inode) != fattr->fileid)
218                 return 0;
219         if (nfs_compare_fh(NFS_FH(inode), fh))
220                 return 0;
221         if (is_bad_inode(inode) || NFS_STALE(inode))
222                 return 0;
223         return 1;
224 }
225
226 static int
227 nfs_init_locked(struct inode *inode, void *opaque)
228 {
229         struct nfs_find_desc    *desc = (struct nfs_find_desc *)opaque;
230         struct nfs_fattr        *fattr = desc->fattr;
231
232         set_nfs_fileid(inode, fattr->fileid);
233         nfs_copy_fh(NFS_FH(inode), desc->fh);
234         return 0;
235 }
236
237 /*
238  * This is our front-end to iget that looks up inodes by file handle
239  * instead of inode number.
240  */
241 struct inode *
242 nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)
243 {
244         struct nfs_find_desc desc = {
245                 .fh     = fh,
246                 .fattr  = fattr
247         };
248         struct inode *inode = ERR_PTR(-ENOENT);
249         unsigned long hash;
250
251         if ((fattr->valid & NFS_ATTR_FATTR_FILEID) == 0)
252                 goto out_no_inode;
253         if ((fattr->valid & NFS_ATTR_FATTR_TYPE) == 0)
254                 goto out_no_inode;
255
256         hash = nfs_fattr_to_ino_t(fattr);
257
258         inode = iget5_locked(sb, hash, nfs_find_actor, nfs_init_locked, &desc);
259         if (inode == NULL) {
260                 inode = ERR_PTR(-ENOMEM);
261                 goto out_no_inode;
262         }
263
264         if (inode->i_state & I_NEW) {
265                 struct nfs_inode *nfsi = NFS_I(inode);
266                 unsigned long now = jiffies;
267
268                 /* We set i_ino for the few things that still rely on it,
269                  * such as stat(2) */
270                 inode->i_ino = hash;
271
272                 /* We can't support update_atime(), since the server will reset it */
273                 inode->i_flags |= S_NOATIME|S_NOCMTIME;
274                 inode->i_mode = fattr->mode;
275                 if ((fattr->valid & NFS_ATTR_FATTR_MODE) == 0
276                                 && nfs_server_capable(inode, NFS_CAP_MODE))
277                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR
278                                 | NFS_INO_INVALID_ACCESS
279                                 | NFS_INO_INVALID_ACL;
280                 /* Why so? Because we want revalidate for devices/FIFOs, and
281                  * that's precisely what we have in nfs_file_inode_operations.
282                  */
283                 inode->i_op = NFS_SB(sb)->nfs_client->rpc_ops->file_inode_ops;
284                 if (S_ISREG(inode->i_mode)) {
285                         inode->i_fop = &nfs_file_operations;
286                         inode->i_data.a_ops = &nfs_file_aops;
287                         inode->i_data.backing_dev_info = &NFS_SB(sb)->backing_dev_info;
288                 } else if (S_ISDIR(inode->i_mode)) {
289                         inode->i_op = NFS_SB(sb)->nfs_client->rpc_ops->dir_inode_ops;
290                         inode->i_fop = &nfs_dir_operations;
291                         if (nfs_server_capable(inode, NFS_CAP_READDIRPLUS))
292                                 set_bit(NFS_INO_ADVISE_RDPLUS, &NFS_I(inode)->flags);
293                         /* Deal with crossing mountpoints */
294                         if ((fattr->valid & NFS_ATTR_FATTR_FSID)
295                                         && !nfs_fsid_equal(&NFS_SB(sb)->fsid, &fattr->fsid)) {
296                                 if (fattr->valid & NFS_ATTR_FATTR_V4_REFERRAL)
297                                         inode->i_op = &nfs_referral_inode_operations;
298                                 else
299                                         inode->i_op = &nfs_mountpoint_inode_operations;
300                                 inode->i_fop = NULL;
301                                 set_bit(NFS_INO_MOUNTPOINT, &nfsi->flags);
302                         }
303                 } else if (S_ISLNK(inode->i_mode))
304                         inode->i_op = &nfs_symlink_inode_operations;
305                 else
306                         init_special_inode(inode, inode->i_mode, fattr->rdev);
307
308                 memset(&inode->i_atime, 0, sizeof(inode->i_atime));
309                 memset(&inode->i_mtime, 0, sizeof(inode->i_mtime));
310                 memset(&inode->i_ctime, 0, sizeof(inode->i_ctime));
311                 nfsi->change_attr = 0;
312                 inode->i_size = 0;
313                 inode->i_nlink = 0;
314                 inode->i_uid = -2;
315                 inode->i_gid = -2;
316                 inode->i_blocks = 0;
317                 memset(nfsi->cookieverf, 0, sizeof(nfsi->cookieverf));
318
319                 nfsi->read_cache_jiffies = fattr->time_start;
320                 nfsi->attr_gencount = fattr->gencount;
321                 if (fattr->valid & NFS_ATTR_FATTR_ATIME)
322                         inode->i_atime = fattr->atime;
323                 else if (nfs_server_capable(inode, NFS_CAP_ATIME))
324                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR;
325                 if (fattr->valid & NFS_ATTR_FATTR_MTIME)
326                         inode->i_mtime = fattr->mtime;
327                 else if (nfs_server_capable(inode, NFS_CAP_MTIME))
328                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR
329                                 | NFS_INO_INVALID_DATA;
330                 if (fattr->valid & NFS_ATTR_FATTR_CTIME)
331                         inode->i_ctime = fattr->ctime;
332                 else if (nfs_server_capable(inode, NFS_CAP_CTIME))
333                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR
334                                 | NFS_INO_INVALID_ACCESS
335                                 | NFS_INO_INVALID_ACL;
336                 if (fattr->valid & NFS_ATTR_FATTR_CHANGE)
337                         nfsi->change_attr = fattr->change_attr;
338                 else if (nfs_server_capable(inode, NFS_CAP_CHANGE_ATTR))
339                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR
340                                 | NFS_INO_INVALID_DATA;
341                 if (fattr->valid & NFS_ATTR_FATTR_SIZE)
342                         inode->i_size = nfs_size_to_loff_t(fattr->size);
343                 else
344                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR
345                                 | NFS_INO_INVALID_DATA
346                                 | NFS_INO_REVAL_PAGECACHE;
347                 if (fattr->valid & NFS_ATTR_FATTR_NLINK)
348                         inode->i_nlink = fattr->nlink;
349                 else if (nfs_server_capable(inode, NFS_CAP_NLINK))
350                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR;
351                 if (fattr->valid & NFS_ATTR_FATTR_OWNER)
352                         inode->i_uid = fattr->uid;
353                 else if (nfs_server_capable(inode, NFS_CAP_OWNER))
354                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR
355                                 | NFS_INO_INVALID_ACCESS
356                                 | NFS_INO_INVALID_ACL;
357                 if (fattr->valid & NFS_ATTR_FATTR_GROUP)
358                         inode->i_gid = fattr->gid;
359                 else if (nfs_server_capable(inode, NFS_CAP_OWNER_GROUP))
360                         nfsi->cache_validity |= NFS_INO_INVALID_ATTR
361                                 | NFS_INO_INVALID_ACCESS
362                                 | NFS_INO_INVALID_ACL;
363                 if (fattr->valid & NFS_ATTR_FATTR_BLOCKS_USED)
364                         inode->i_blocks = fattr->du.nfs2.blocks;
365                 if (fattr->valid & NFS_ATTR_FATTR_SPACE_USED) {
366                         /*
367                          * report the blocks in 512byte units
368                          */
369                         inode->i_blocks = nfs_calc_block_size(fattr->du.nfs3.used);
370                 }
371                 nfsi->attrtimeo = NFS_MINATTRTIMEO(inode);
372                 nfsi->attrtimeo_timestamp = now;
373                 nfsi->access_cache = RB_ROOT;
374
375                 nfs_fscache_init_inode_cookie(inode);
376
377                 unlock_new_inode(inode);
378         } else
379                 nfs_refresh_inode(inode, fattr);
380         dprintk("NFS: nfs_fhget(%s/%Ld ct=%d)\n",
381                 inode->i_sb->s_id,
382                 (long long)NFS_FILEID(inode),
383                 atomic_read(&inode->i_count));
384
385 out:
386         return inode;
387
388 out_no_inode:
389         dprintk("nfs_fhget: iget failed with error %ld\n", PTR_ERR(inode));
390         goto out;
391 }
392
393 #define NFS_VALID_ATTRS (ATTR_MODE|ATTR_UID|ATTR_GID|ATTR_SIZE|ATTR_ATIME|ATTR_ATIME_SET|ATTR_MTIME|ATTR_MTIME_SET|ATTR_FILE)
394
395 int
396 nfs_setattr(struct dentry *dentry, struct iattr *attr)
397 {
398         struct inode *inode = dentry->d_inode;
399         struct nfs_fattr *fattr;
400         int error = -ENOMEM;
401
402         nfs_inc_stats(inode, NFSIOS_VFSSETATTR);
403
404         /* skip mode change if it's just for clearing setuid/setgid */
405         if (attr->ia_valid & (ATTR_KILL_SUID | ATTR_KILL_SGID))
406                 attr->ia_valid &= ~ATTR_MODE;
407
408         if (attr->ia_valid & ATTR_SIZE) {
409                 if (!S_ISREG(inode->i_mode) || attr->ia_size == i_size_read(inode))
410                         attr->ia_valid &= ~ATTR_SIZE;
411         }
412
413         /* Optimization: if the end result is no change, don't RPC */
414         attr->ia_valid &= NFS_VALID_ATTRS;
415         if ((attr->ia_valid & ~ATTR_FILE) == 0)
416                 return 0;
417
418         /* Write all dirty data */
419         if (S_ISREG(inode->i_mode))
420                 nfs_wb_all(inode);
421
422         fattr = nfs_alloc_fattr();
423         if (fattr == NULL)
424                 goto out;
425         /*
426          * Return any delegations if we're going to change ACLs
427          */
428         if ((attr->ia_valid & (ATTR_MODE|ATTR_UID|ATTR_GID)) != 0)
429                 nfs_inode_return_delegation(inode);
430         error = NFS_PROTO(inode)->setattr(dentry, fattr, attr);
431         if (error == 0)
432                 nfs_refresh_inode(inode, fattr);
433         nfs_free_fattr(fattr);
434 out:
435         return error;
436 }
437
438 /**
439  * nfs_vmtruncate - unmap mappings "freed" by truncate() syscall
440  * @inode: inode of the file used
441  * @offset: file offset to start truncating
442  *
443  * This is a copy of the common vmtruncate, but with the locking
444  * corrected to take into account the fact that NFS requires
445  * inode->i_size to be updated under the inode->i_lock.
446  */
447 static int nfs_vmtruncate(struct inode * inode, loff_t offset)
448 {
449         loff_t oldsize;
450         int err;
451
452         err = inode_newsize_ok(inode, offset);
453         if (err)
454                 goto out;
455
456         spin_lock(&inode->i_lock);
457         oldsize = inode->i_size;
458         i_size_write(inode, offset);
459         spin_unlock(&inode->i_lock);
460
461         truncate_pagecache(inode, oldsize, offset);
462 out:
463         return err;
464 }
465
466 /**
467  * nfs_setattr_update_inode - Update inode metadata after a setattr call.
468  * @inode: pointer to struct inode
469  * @attr: pointer to struct iattr
470  *
471  * Note: we do this in the *proc.c in order to ensure that
472  *       it works for things like exclusive creates too.
473  */
474 void nfs_setattr_update_inode(struct inode *inode, struct iattr *attr)
475 {
476         if ((attr->ia_valid & (ATTR_MODE|ATTR_UID|ATTR_GID)) != 0) {
477                 spin_lock(&inode->i_lock);
478                 if ((attr->ia_valid & ATTR_MODE) != 0) {
479                         int mode = attr->ia_mode & S_IALLUGO;
480                         mode |= inode->i_mode & ~S_IALLUGO;
481                         inode->i_mode = mode;
482                 }
483                 if ((attr->ia_valid & ATTR_UID) != 0)
484                         inode->i_uid = attr->ia_uid;
485                 if ((attr->ia_valid & ATTR_GID) != 0)
486                         inode->i_gid = attr->ia_gid;
487                 NFS_I(inode)->cache_validity |= NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL;
488                 spin_unlock(&inode->i_lock);
489         }
490         if ((attr->ia_valid & ATTR_SIZE) != 0) {
491                 nfs_inc_stats(inode, NFSIOS_SETATTRTRUNC);
492                 nfs_vmtruncate(inode, attr->ia_size);
493         }
494 }
495
496 int nfs_getattr(struct vfsmount *mnt, struct dentry *dentry, struct kstat *stat)
497 {
498         struct inode *inode = dentry->d_inode;
499         int need_atime = NFS_I(inode)->cache_validity & NFS_INO_INVALID_ATIME;
500         int err;
501
502         /* Flush out writes to the server in order to update c/mtime.  */
503         if (S_ISREG(inode->i_mode)) {
504                 err = filemap_write_and_wait(inode->i_mapping);
505                 if (err)
506                         goto out;
507         }
508
509         /*
510          * We may force a getattr if the user cares about atime.
511          *
512          * Note that we only have to check the vfsmount flags here:
513          *  - NFS always sets S_NOATIME by so checking it would give a
514          *    bogus result
515          *  - NFS never sets MS_NOATIME or MS_NODIRATIME so there is
516          *    no point in checking those.
517          */
518         if ((mnt->mnt_flags & MNT_NOATIME) ||
519             ((mnt->mnt_flags & MNT_NODIRATIME) && S_ISDIR(inode->i_mode)))
520                 need_atime = 0;
521
522         if (need_atime)
523                 err = __nfs_revalidate_inode(NFS_SERVER(inode), inode);
524         else
525                 err = nfs_revalidate_inode(NFS_SERVER(inode), inode);
526         if (!err) {
527                 generic_fillattr(inode, stat);
528                 stat->ino = nfs_compat_user_ino64(NFS_FILEID(inode));
529         }
530 out:
531         return err;
532 }
533
534 static void nfs_init_lock_context(struct nfs_lock_context *l_ctx)
535 {
536         atomic_set(&l_ctx->count, 1);
537         l_ctx->lockowner = current->files;
538         l_ctx->pid = current->tgid;
539         INIT_LIST_HEAD(&l_ctx->list);
540 }
541
542 static struct nfs_lock_context *__nfs_find_lock_context(struct nfs_open_context *ctx)
543 {
544         struct nfs_lock_context *pos;
545
546         list_for_each_entry(pos, &ctx->lock_context.list, list) {
547                 if (pos->lockowner != current->files)
548                         continue;
549                 if (pos->pid != current->tgid)
550                         continue;
551                 atomic_inc(&pos->count);
552                 return pos;
553         }
554         return NULL;
555 }
556
557 struct nfs_lock_context *nfs_get_lock_context(struct nfs_open_context *ctx)
558 {
559         struct nfs_lock_context *res, *new = NULL;
560         struct inode *inode = ctx->path.dentry->d_inode;
561
562         spin_lock(&inode->i_lock);
563         res = __nfs_find_lock_context(ctx);
564         if (res == NULL) {
565                 spin_unlock(&inode->i_lock);
566                 new = kmalloc(sizeof(*new), GFP_KERNEL);
567                 if (new == NULL)
568                         return NULL;
569                 nfs_init_lock_context(new);
570                 spin_lock(&inode->i_lock);
571                 res = __nfs_find_lock_context(ctx);
572                 if (res == NULL) {
573                         list_add_tail(&new->list, &ctx->lock_context.list);
574                         new->open_context = ctx;
575                         res = new;
576                         new = NULL;
577                 }
578         }
579         spin_unlock(&inode->i_lock);
580         kfree(new);
581         return res;
582 }
583
584 void nfs_put_lock_context(struct nfs_lock_context *l_ctx)
585 {
586         struct nfs_open_context *ctx = l_ctx->open_context;
587         struct inode *inode = ctx->path.dentry->d_inode;
588
589         if (!atomic_dec_and_lock(&l_ctx->count, &inode->i_lock))
590                 return;
591         list_del(&l_ctx->list);
592         spin_unlock(&inode->i_lock);
593         kfree(l_ctx);
594 }
595
596 /**
597  * nfs_close_context - Common close_context() routine NFSv2/v3
598  * @ctx: pointer to context
599  * @is_sync: is this a synchronous close
600  *
601  * always ensure that the attributes are up to date if we're mounted
602  * with close-to-open semantics
603  */
604 void nfs_close_context(struct nfs_open_context *ctx, int is_sync)
605 {
606         struct inode *inode;
607         struct nfs_server *server;
608
609         if (!(ctx->mode & FMODE_WRITE))
610                 return;
611         if (!is_sync)
612                 return;
613         inode = ctx->path.dentry->d_inode;
614         if (!list_empty(&NFS_I(inode)->open_files))
615                 return;
616         server = NFS_SERVER(inode);
617         if (server->flags & NFS_MOUNT_NOCTO)
618                 return;
619         nfs_revalidate_inode(server, inode);
620 }
621
622 struct nfs_open_context *alloc_nfs_open_context(struct path *path, struct rpc_cred *cred, fmode_t f_mode)
623 {
624         struct nfs_open_context *ctx;
625
626         ctx = kmalloc(sizeof(*ctx), GFP_KERNEL);
627         if (ctx != NULL) {
628                 ctx->path = *path;
629                 path_get(&ctx->path);
630                 ctx->cred = get_rpccred(cred);
631                 ctx->state = NULL;
632                 ctx->mode = f_mode;
633                 ctx->flags = 0;
634                 ctx->error = 0;
635                 ctx->dir_cookie = 0;
636                 nfs_init_lock_context(&ctx->lock_context);
637                 ctx->lock_context.open_context = ctx;
638                 INIT_LIST_HEAD(&ctx->list);
639         }
640         return ctx;
641 }
642
643 struct nfs_open_context *get_nfs_open_context(struct nfs_open_context *ctx)
644 {
645         if (ctx != NULL)
646                 atomic_inc(&ctx->lock_context.count);
647         return ctx;
648 }
649
650 static void __put_nfs_open_context(struct nfs_open_context *ctx, int is_sync)
651 {
652         struct inode *inode = ctx->path.dentry->d_inode;
653
654         if (!list_empty(&ctx->list)) {
655                 if (!atomic_dec_and_lock(&ctx->lock_context.count, &inode->i_lock))
656                         return;
657                 list_del(&ctx->list);
658                 spin_unlock(&inode->i_lock);
659         } else if (!atomic_dec_and_test(&ctx->lock_context.count))
660                 return;
661         if (inode != NULL)
662                 NFS_PROTO(inode)->close_context(ctx, is_sync);
663         if (ctx->cred != NULL)
664                 put_rpccred(ctx->cred);
665         path_put(&ctx->path);
666         kfree(ctx);
667 }
668
669 void put_nfs_open_context(struct nfs_open_context *ctx)
670 {
671         __put_nfs_open_context(ctx, 0);
672 }
673
674 /*
675  * Ensure that mmap has a recent RPC credential for use when writing out
676  * shared pages
677  */
678 void nfs_file_set_open_context(struct file *filp, struct nfs_open_context *ctx)
679 {
680         struct inode *inode = filp->f_path.dentry->d_inode;
681         struct nfs_inode *nfsi = NFS_I(inode);
682
683         filp->private_data = get_nfs_open_context(ctx);
684         spin_lock(&inode->i_lock);
685         list_add(&ctx->list, &nfsi->open_files);
686         spin_unlock(&inode->i_lock);
687 }
688
689 /*
690  * Given an inode, search for an open context with the desired characteristics
691  */
692 struct nfs_open_context *nfs_find_open_context(struct inode *inode, struct rpc_cred *cred, fmode_t mode)
693 {
694         struct nfs_inode *nfsi = NFS_I(inode);
695         struct nfs_open_context *pos, *ctx = NULL;
696
697         spin_lock(&inode->i_lock);
698         list_for_each_entry(pos, &nfsi->open_files, list) {
699                 if (cred != NULL && pos->cred != cred)
700                         continue;
701                 if ((pos->mode & (FMODE_READ|FMODE_WRITE)) != mode)
702                         continue;
703                 ctx = get_nfs_open_context(pos);
704                 break;
705         }
706         spin_unlock(&inode->i_lock);
707         return ctx;
708 }
709
710 static void nfs_file_clear_open_context(struct file *filp)
711 {
712         struct inode *inode = filp->f_path.dentry->d_inode;
713         struct nfs_open_context *ctx = nfs_file_open_context(filp);
714
715         if (ctx) {
716                 filp->private_data = NULL;
717                 spin_lock(&inode->i_lock);
718                 list_move_tail(&ctx->list, &NFS_I(inode)->open_files);
719                 spin_unlock(&inode->i_lock);
720                 __put_nfs_open_context(ctx, filp->f_flags & O_DIRECT ? 0 : 1);
721         }
722 }
723
724 /*
725  * These allocate and release file read/write context information.
726  */
727 int nfs_open(struct inode *inode, struct file *filp)
728 {
729         struct nfs_open_context *ctx;
730         struct rpc_cred *cred;
731
732         cred = rpc_lookup_cred();
733         if (IS_ERR(cred))
734                 return PTR_ERR(cred);
735         ctx = alloc_nfs_open_context(&filp->f_path, cred, filp->f_mode);
736         put_rpccred(cred);
737         if (ctx == NULL)
738                 return -ENOMEM;
739         nfs_file_set_open_context(filp, ctx);
740         put_nfs_open_context(ctx);
741         nfs_fscache_set_inode_cookie(inode, filp);
742         return 0;
743 }
744
745 int nfs_release(struct inode *inode, struct file *filp)
746 {
747         nfs_file_clear_open_context(filp);
748         return 0;
749 }
750
751 /*
752  * This function is called whenever some part of NFS notices that
753  * the cached attributes have to be refreshed.
754  */
755 int
756 __nfs_revalidate_inode(struct nfs_server *server, struct inode *inode)
757 {
758         int              status = -ESTALE;
759         struct nfs_fattr *fattr = NULL;
760         struct nfs_inode *nfsi = NFS_I(inode);
761
762         dfprintk(PAGECACHE, "NFS: revalidating (%s/%Ld)\n",
763                 inode->i_sb->s_id, (long long)NFS_FILEID(inode));
764
765         if (is_bad_inode(inode))
766                 goto out;
767         if (NFS_STALE(inode))
768                 goto out;
769
770         status = -ENOMEM;
771         fattr = nfs_alloc_fattr();
772         if (fattr == NULL)
773                 goto out;
774
775         nfs_inc_stats(inode, NFSIOS_INODEREVALIDATE);
776         status = NFS_PROTO(inode)->getattr(server, NFS_FH(inode), fattr);
777         if (status != 0) {
778                 dfprintk(PAGECACHE, "nfs_revalidate_inode: (%s/%Ld) getattr failed, error=%d\n",
779                          inode->i_sb->s_id,
780                          (long long)NFS_FILEID(inode), status);
781                 if (status == -ESTALE) {
782                         nfs_zap_caches(inode);
783                         if (!S_ISDIR(inode->i_mode))
784                                 set_bit(NFS_INO_STALE, &NFS_I(inode)->flags);
785                 }
786                 goto out;
787         }
788
789         status = nfs_refresh_inode(inode, fattr);
790         if (status) {
791                 dfprintk(PAGECACHE, "nfs_revalidate_inode: (%s/%Ld) refresh failed, error=%d\n",
792                          inode->i_sb->s_id,
793                          (long long)NFS_FILEID(inode), status);
794                 goto out;
795         }
796
797         if (nfsi->cache_validity & NFS_INO_INVALID_ACL)
798                 nfs_zap_acl_cache(inode);
799
800         dfprintk(PAGECACHE, "NFS: (%s/%Ld) revalidation complete\n",
801                 inode->i_sb->s_id,
802                 (long long)NFS_FILEID(inode));
803
804  out:
805         nfs_free_fattr(fattr);
806         return status;
807 }
808
809 int nfs_attribute_timeout(struct inode *inode)
810 {
811         struct nfs_inode *nfsi = NFS_I(inode);
812
813         return !time_in_range_open(jiffies, nfsi->read_cache_jiffies, nfsi->read_cache_jiffies + nfsi->attrtimeo);
814 }
815
816 static int nfs_attribute_cache_expired(struct inode *inode)
817 {
818         if (nfs_have_delegated_attributes(inode))
819                 return 0;
820         return nfs_attribute_timeout(inode);
821 }
822
823 /**
824  * nfs_revalidate_inode - Revalidate the inode attributes
825  * @server - pointer to nfs_server struct
826  * @inode - pointer to inode struct
827  *
828  * Updates inode attribute information by retrieving the data from the server.
829  */
830 int nfs_revalidate_inode(struct nfs_server *server, struct inode *inode)
831 {
832         if (!(NFS_I(inode)->cache_validity & NFS_INO_INVALID_ATTR)
833                         && !nfs_attribute_cache_expired(inode))
834                 return NFS_STALE(inode) ? -ESTALE : 0;
835         return __nfs_revalidate_inode(server, inode);
836 }
837
838 static int nfs_invalidate_mapping(struct inode *inode, struct address_space *mapping)
839 {
840         struct nfs_inode *nfsi = NFS_I(inode);
841         
842         if (mapping->nrpages != 0) {
843                 int ret = invalidate_inode_pages2(mapping);
844                 if (ret < 0)
845                         return ret;
846         }
847         spin_lock(&inode->i_lock);
848         nfsi->cache_validity &= ~NFS_INO_INVALID_DATA;
849         if (S_ISDIR(inode->i_mode))
850                 memset(nfsi->cookieverf, 0, sizeof(nfsi->cookieverf));
851         spin_unlock(&inode->i_lock);
852         nfs_inc_stats(inode, NFSIOS_DATAINVALIDATE);
853         nfs_fscache_reset_inode_cookie(inode);
854         dfprintk(PAGECACHE, "NFS: (%s/%Ld) data cache invalidated\n",
855                         inode->i_sb->s_id, (long long)NFS_FILEID(inode));
856         return 0;
857 }
858
859 /**
860  * nfs_revalidate_mapping - Revalidate the pagecache
861  * @inode - pointer to host inode
862  * @mapping - pointer to mapping
863  */
864 int nfs_revalidate_mapping(struct inode *inode, struct address_space *mapping)
865 {
866         struct nfs_inode *nfsi = NFS_I(inode);
867         int ret = 0;
868
869         if ((nfsi->cache_validity & NFS_INO_REVAL_PAGECACHE)
870                         || nfs_attribute_cache_expired(inode)
871                         || NFS_STALE(inode)) {
872                 ret = __nfs_revalidate_inode(NFS_SERVER(inode), inode);
873                 if (ret < 0)
874                         goto out;
875         }
876         if (nfsi->cache_validity & NFS_INO_INVALID_DATA)
877                 ret = nfs_invalidate_mapping(inode, mapping);
878 out:
879         return ret;
880 }
881
882 static void nfs_wcc_update_inode(struct inode *inode, struct nfs_fattr *fattr)
883 {
884         struct nfs_inode *nfsi = NFS_I(inode);
885
886         if ((fattr->valid & NFS_ATTR_FATTR_PRECHANGE)
887                         && (fattr->valid & NFS_ATTR_FATTR_CHANGE)
888                         && nfsi->change_attr == fattr->pre_change_attr) {
889                 nfsi->change_attr = fattr->change_attr;
890                 if (S_ISDIR(inode->i_mode))
891                         nfsi->cache_validity |= NFS_INO_INVALID_DATA;
892         }
893         /* If we have atomic WCC data, we may update some attributes */
894         if ((fattr->valid & NFS_ATTR_FATTR_PRECTIME)
895                         && (fattr->valid & NFS_ATTR_FATTR_CTIME)
896                         && timespec_equal(&inode->i_ctime, &fattr->pre_ctime))
897                         memcpy(&inode->i_ctime, &fattr->ctime, sizeof(inode->i_ctime));
898
899         if ((fattr->valid & NFS_ATTR_FATTR_PREMTIME)
900                         && (fattr->valid & NFS_ATTR_FATTR_MTIME)
901                         && timespec_equal(&inode->i_mtime, &fattr->pre_mtime)) {
902                         memcpy(&inode->i_mtime, &fattr->mtime, sizeof(inode->i_mtime));
903                         if (S_ISDIR(inode->i_mode))
904                                 nfsi->cache_validity |= NFS_INO_INVALID_DATA;
905         }
906         if ((fattr->valid & NFS_ATTR_FATTR_PRESIZE)
907                         && (fattr->valid & NFS_ATTR_FATTR_SIZE)
908                         && i_size_read(inode) == nfs_size_to_loff_t(fattr->pre_size)
909                         && nfsi->npages == 0)
910                         i_size_write(inode, nfs_size_to_loff_t(fattr->size));
911 }
912
913 /**
914  * nfs_check_inode_attributes - verify consistency of the inode attribute cache
915  * @inode - pointer to inode
916  * @fattr - updated attributes
917  *
918  * Verifies the attribute cache. If we have just changed the attributes,
919  * so that fattr carries weak cache consistency data, then it may
920  * also update the ctime/mtime/change_attribute.
921  */
922 static int nfs_check_inode_attributes(struct inode *inode, struct nfs_fattr *fattr)
923 {
924         struct nfs_inode *nfsi = NFS_I(inode);
925         loff_t cur_size, new_isize;
926         unsigned long invalid = 0;
927
928
929         /* Has the inode gone and changed behind our back? */
930         if ((fattr->valid & NFS_ATTR_FATTR_FILEID) && nfsi->fileid != fattr->fileid)
931                 return -EIO;
932         if ((fattr->valid & NFS_ATTR_FATTR_TYPE) && (inode->i_mode & S_IFMT) != (fattr->mode & S_IFMT))
933                 return -EIO;
934
935         if ((fattr->valid & NFS_ATTR_FATTR_CHANGE) != 0 &&
936                         nfsi->change_attr != fattr->change_attr)
937                 invalid |= NFS_INO_INVALID_ATTR|NFS_INO_REVAL_PAGECACHE;
938
939         /* Verify a few of the more important attributes */
940         if ((fattr->valid & NFS_ATTR_FATTR_MTIME) && !timespec_equal(&inode->i_mtime, &fattr->mtime))
941                 invalid |= NFS_INO_INVALID_ATTR|NFS_INO_REVAL_PAGECACHE;
942
943         if (fattr->valid & NFS_ATTR_FATTR_SIZE) {
944                 cur_size = i_size_read(inode);
945                 new_isize = nfs_size_to_loff_t(fattr->size);
946                 if (cur_size != new_isize && nfsi->npages == 0)
947                         invalid |= NFS_INO_INVALID_ATTR|NFS_INO_REVAL_PAGECACHE;
948         }
949
950         /* Have any file permissions changed? */
951         if ((fattr->valid & NFS_ATTR_FATTR_MODE) && (inode->i_mode & S_IALLUGO) != (fattr->mode & S_IALLUGO))
952                 invalid |= NFS_INO_INVALID_ATTR | NFS_INO_INVALID_ACCESS | NFS_INO_INVALID_ACL;
953         if ((fattr->valid & NFS_ATTR_FATTR_OWNER) && inode->i_uid != fattr->uid)
954                 invalid |= NFS_INO_INVALID_ATTR | NFS_INO_INVALID_ACCESS | NFS_INO_INVALID_ACL;
955         if ((fattr->valid & NFS_ATTR_FATTR_GROUP) && inode->i_gid != fattr->gid)
956                 invalid |= NFS_INO_INVALID_ATTR | NFS_INO_INVALID_ACCESS | NFS_INO_INVALID_ACL;
957
958         /* Has the link count changed? */
959         if ((fattr->valid & NFS_ATTR_FATTR_NLINK) && inode->i_nlink != fattr->nlink)
960                 invalid |= NFS_INO_INVALID_ATTR;
961
962         if ((fattr->valid & NFS_ATTR_FATTR_ATIME) && !timespec_equal(&inode->i_atime, &fattr->atime))
963                 invalid |= NFS_INO_INVALID_ATIME;
964
965         if (invalid != 0)
966                 nfsi->cache_validity |= invalid;
967
968         nfsi->read_cache_jiffies = fattr->time_start;
969         return 0;
970 }
971
972 static int nfs_ctime_need_update(const struct inode *inode, const struct nfs_fattr *fattr)
973 {
974         if (!(fattr->valid & NFS_ATTR_FATTR_CTIME))
975                 return 0;
976         return timespec_compare(&fattr->ctime, &inode->i_ctime) > 0;
977 }
978
979 static int nfs_size_need_update(const struct inode *inode, const struct nfs_fattr *fattr)
980 {
981         if (!(fattr->valid & NFS_ATTR_FATTR_SIZE))
982                 return 0;
983         return nfs_size_to_loff_t(fattr->size) > i_size_read(inode);
984 }
985
986 static atomic_long_t nfs_attr_generation_counter;
987
988 static unsigned long nfs_read_attr_generation_counter(void)
989 {
990         return atomic_long_read(&nfs_attr_generation_counter);
991 }
992
993 unsigned long nfs_inc_attr_generation_counter(void)
994 {
995         return atomic_long_inc_return(&nfs_attr_generation_counter);
996 }
997
998 void nfs_fattr_init(struct nfs_fattr *fattr)
999 {
1000         fattr->valid = 0;
1001         fattr->time_start = jiffies;
1002         fattr->gencount = nfs_inc_attr_generation_counter();
1003 }
1004
1005 struct nfs_fattr *nfs_alloc_fattr(void)
1006 {
1007         struct nfs_fattr *fattr;
1008
1009         fattr = kmalloc(sizeof(*fattr), GFP_NOFS);
1010         if (fattr != NULL)
1011                 nfs_fattr_init(fattr);
1012         return fattr;
1013 }
1014
1015 struct nfs_fh *nfs_alloc_fhandle(void)
1016 {
1017         struct nfs_fh *fh;
1018
1019         fh = kmalloc(sizeof(struct nfs_fh), GFP_NOFS);
1020         if (fh != NULL)
1021                 fh->size = 0;
1022         return fh;
1023 }
1024
1025 /**
1026  * nfs_inode_attrs_need_update - check if the inode attributes need updating
1027  * @inode - pointer to inode
1028  * @fattr - attributes
1029  *
1030  * Attempt to divine whether or not an RPC call reply carrying stale
1031  * attributes got scheduled after another call carrying updated ones.
1032  *
1033  * To do so, the function first assumes that a more recent ctime means
1034  * that the attributes in fattr are newer, however it also attempt to
1035  * catch the case where ctime either didn't change, or went backwards
1036  * (if someone reset the clock on the server) by looking at whether
1037  * or not this RPC call was started after the inode was last updated.
1038  * Note also the check for wraparound of 'attr_gencount'
1039  *
1040  * The function returns 'true' if it thinks the attributes in 'fattr' are
1041  * more recent than the ones cached in the inode.
1042  *
1043  */
1044 static int nfs_inode_attrs_need_update(const struct inode *inode, const struct nfs_fattr *fattr)
1045 {
1046         const struct nfs_inode *nfsi = NFS_I(inode);
1047
1048         return ((long)fattr->gencount - (long)nfsi->attr_gencount) > 0 ||
1049                 nfs_ctime_need_update(inode, fattr) ||
1050                 nfs_size_need_update(inode, fattr) ||
1051                 ((long)nfsi->attr_gencount - (long)nfs_read_attr_generation_counter() > 0);
1052 }
1053
1054 static int nfs_refresh_inode_locked(struct inode *inode, struct nfs_fattr *fattr)
1055 {
1056         if (nfs_inode_attrs_need_update(inode, fattr))
1057                 return nfs_update_inode(inode, fattr);
1058         return nfs_check_inode_attributes(inode, fattr);
1059 }
1060
1061 /**
1062  * nfs_refresh_inode - try to update the inode attribute cache
1063  * @inode - pointer to inode
1064  * @fattr - updated attributes
1065  *
1066  * Check that an RPC call that returned attributes has not overlapped with
1067  * other recent updates of the inode metadata, then decide whether it is
1068  * safe to do a full update of the inode attributes, or whether just to
1069  * call nfs_check_inode_attributes.
1070  */
1071 int nfs_refresh_inode(struct inode *inode, struct nfs_fattr *fattr)
1072 {
1073         int status;
1074
1075         if ((fattr->valid & NFS_ATTR_FATTR) == 0)
1076                 return 0;
1077         spin_lock(&inode->i_lock);
1078         status = nfs_refresh_inode_locked(inode, fattr);
1079         spin_unlock(&inode->i_lock);
1080
1081         return status;
1082 }
1083
1084 static int nfs_post_op_update_inode_locked(struct inode *inode, struct nfs_fattr *fattr)
1085 {
1086         struct nfs_inode *nfsi = NFS_I(inode);
1087
1088         nfsi->cache_validity |= NFS_INO_INVALID_ATTR|NFS_INO_REVAL_PAGECACHE;
1089         if (S_ISDIR(inode->i_mode))
1090                 nfsi->cache_validity |= NFS_INO_INVALID_DATA;
1091         if ((fattr->valid & NFS_ATTR_FATTR) == 0)
1092                 return 0;
1093         return nfs_refresh_inode_locked(inode, fattr);
1094 }
1095
1096 /**
1097  * nfs_post_op_update_inode - try to update the inode attribute cache
1098  * @inode - pointer to inode
1099  * @fattr - updated attributes
1100  *
1101  * After an operation that has changed the inode metadata, mark the
1102  * attribute cache as being invalid, then try to update it.
1103  *
1104  * NB: if the server didn't return any post op attributes, this
1105  * function will force the retrieval of attributes before the next
1106  * NFS request.  Thus it should be used only for operations that
1107  * are expected to change one or more attributes, to avoid
1108  * unnecessary NFS requests and trips through nfs_update_inode().
1109  */
1110 int nfs_post_op_update_inode(struct inode *inode, struct nfs_fattr *fattr)
1111 {
1112         int status;
1113
1114         spin_lock(&inode->i_lock);
1115         status = nfs_post_op_update_inode_locked(inode, fattr);
1116         spin_unlock(&inode->i_lock);
1117         return status;
1118 }
1119
1120 /**
1121  * nfs_post_op_update_inode_force_wcc - try to update the inode attribute cache
1122  * @inode - pointer to inode
1123  * @fattr - updated attributes
1124  *
1125  * After an operation that has changed the inode metadata, mark the
1126  * attribute cache as being invalid, then try to update it. Fake up
1127  * weak cache consistency data, if none exist.
1128  *
1129  * This function is mainly designed to be used by the ->write_done() functions.
1130  */
1131 int nfs_post_op_update_inode_force_wcc(struct inode *inode, struct nfs_fattr *fattr)
1132 {
1133         int status;
1134
1135         spin_lock(&inode->i_lock);
1136         /* Don't do a WCC update if these attributes are already stale */
1137         if ((fattr->valid & NFS_ATTR_FATTR) == 0 ||
1138                         !nfs_inode_attrs_need_update(inode, fattr)) {
1139                 fattr->valid &= ~(NFS_ATTR_FATTR_PRECHANGE
1140                                 | NFS_ATTR_FATTR_PRESIZE
1141                                 | NFS_ATTR_FATTR_PREMTIME
1142                                 | NFS_ATTR_FATTR_PRECTIME);
1143                 goto out_noforce;
1144         }
1145         if ((fattr->valid & NFS_ATTR_FATTR_CHANGE) != 0 &&
1146                         (fattr->valid & NFS_ATTR_FATTR_PRECHANGE) == 0) {
1147                 fattr->pre_change_attr = NFS_I(inode)->change_attr;
1148                 fattr->valid |= NFS_ATTR_FATTR_PRECHANGE;
1149         }
1150         if ((fattr->valid & NFS_ATTR_FATTR_CTIME) != 0 &&
1151                         (fattr->valid & NFS_ATTR_FATTR_PRECTIME) == 0) {
1152                 memcpy(&fattr->pre_ctime, &inode->i_ctime, sizeof(fattr->pre_ctime));
1153                 fattr->valid |= NFS_ATTR_FATTR_PRECTIME;
1154         }
1155         if ((fattr->valid & NFS_ATTR_FATTR_MTIME) != 0 &&
1156                         (fattr->valid & NFS_ATTR_FATTR_PREMTIME) == 0) {
1157                 memcpy(&fattr->pre_mtime, &inode->i_mtime, sizeof(fattr->pre_mtime));
1158                 fattr->valid |= NFS_ATTR_FATTR_PREMTIME;
1159         }
1160         if ((fattr->valid & NFS_ATTR_FATTR_SIZE) != 0 &&
1161                         (fattr->valid & NFS_ATTR_FATTR_PRESIZE) == 0) {
1162                 fattr->pre_size = i_size_read(inode);
1163                 fattr->valid |= NFS_ATTR_FATTR_PRESIZE;
1164         }
1165 out_noforce:
1166         status = nfs_post_op_update_inode_locked(inode, fattr);
1167         spin_unlock(&inode->i_lock);
1168         return status;
1169 }
1170
1171 /*
1172  * Many nfs protocol calls return the new file attributes after
1173  * an operation.  Here we update the inode to reflect the state
1174  * of the server's inode.
1175  *
1176  * This is a bit tricky because we have to make sure all dirty pages
1177  * have been sent off to the server before calling invalidate_inode_pages.
1178  * To make sure no other process adds more write requests while we try
1179  * our best to flush them, we make them sleep during the attribute refresh.
1180  *
1181  * A very similar scenario holds for the dir cache.
1182  */
1183 static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)
1184 {
1185         struct nfs_server *server;
1186         struct nfs_inode *nfsi = NFS_I(inode);
1187         loff_t cur_isize, new_isize;
1188         unsigned long invalid = 0;
1189         unsigned long now = jiffies;
1190         unsigned long save_cache_validity;
1191
1192         dfprintk(VFS, "NFS: %s(%s/%ld ct=%d info=0x%x)\n",
1193                         __func__, inode->i_sb->s_id, inode->i_ino,
1194                         atomic_read(&inode->i_count), fattr->valid);
1195
1196         if ((fattr->valid & NFS_ATTR_FATTR_FILEID) && nfsi->fileid != fattr->fileid)
1197                 goto out_fileid;
1198
1199         /*
1200          * Make sure the inode's type hasn't changed.
1201          */
1202         if ((fattr->valid & NFS_ATTR_FATTR_TYPE) && (inode->i_mode & S_IFMT) != (fattr->mode & S_IFMT))
1203                 goto out_changed;
1204
1205         server = NFS_SERVER(inode);
1206         /* Update the fsid? */
1207         if (S_ISDIR(inode->i_mode) && (fattr->valid & NFS_ATTR_FATTR_FSID) &&
1208                         !nfs_fsid_equal(&server->fsid, &fattr->fsid) &&
1209                         !test_bit(NFS_INO_MOUNTPOINT, &nfsi->flags))
1210                 server->fsid = fattr->fsid;
1211
1212         /*
1213          * Update the read time so we don't revalidate too often.
1214          */
1215         nfsi->read_cache_jiffies = fattr->time_start;
1216
1217         save_cache_validity = nfsi->cache_validity;
1218         nfsi->cache_validity &= ~(NFS_INO_INVALID_ATTR
1219                         | NFS_INO_INVALID_ATIME
1220                         | NFS_INO_REVAL_FORCED
1221                         | NFS_INO_REVAL_PAGECACHE);
1222
1223         /* Do atomic weak cache consistency updates */
1224         nfs_wcc_update_inode(inode, fattr);
1225
1226         /* More cache consistency checks */
1227         if (fattr->valid & NFS_ATTR_FATTR_CHANGE) {
1228                 if (nfsi->change_attr != fattr->change_attr) {
1229                         dprintk("NFS: change_attr change on server for file %s/%ld\n",
1230                                         inode->i_sb->s_id, inode->i_ino);
1231                         invalid |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_DATA|NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL;
1232                         if (S_ISDIR(inode->i_mode))
1233                                 nfs_force_lookup_revalidate(inode);
1234                         nfsi->change_attr = fattr->change_attr;
1235                 }
1236         } else if (server->caps & NFS_CAP_CHANGE_ATTR)
1237                 invalid |= save_cache_validity;
1238
1239         if (fattr->valid & NFS_ATTR_FATTR_MTIME) {
1240                 /* NFSv2/v3: Check if the mtime agrees */
1241                 if (!timespec_equal(&inode->i_mtime, &fattr->mtime)) {
1242                         dprintk("NFS: mtime change on server for file %s/%ld\n",
1243                                         inode->i_sb->s_id, inode->i_ino);
1244                         invalid |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_DATA;
1245                         if (S_ISDIR(inode->i_mode))
1246                                 nfs_force_lookup_revalidate(inode);
1247                         memcpy(&inode->i_mtime, &fattr->mtime, sizeof(inode->i_mtime));
1248                 }
1249         } else if (server->caps & NFS_CAP_MTIME)
1250                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATTR
1251                                 | NFS_INO_INVALID_DATA
1252                                 | NFS_INO_REVAL_PAGECACHE
1253                                 | NFS_INO_REVAL_FORCED);
1254
1255         if (fattr->valid & NFS_ATTR_FATTR_CTIME) {
1256                 /* If ctime has changed we should definitely clear access+acl caches */
1257                 if (!timespec_equal(&inode->i_ctime, &fattr->ctime)) {
1258                         invalid |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL;
1259                         /* and probably clear data for a directory too as utimes can cause
1260                          * havoc with our cache.
1261                          */
1262                         if (S_ISDIR(inode->i_mode)) {
1263                                 invalid |= NFS_INO_INVALID_DATA;
1264                                 nfs_force_lookup_revalidate(inode);
1265                         }
1266                         memcpy(&inode->i_ctime, &fattr->ctime, sizeof(inode->i_ctime));
1267                 }
1268         } else if (server->caps & NFS_CAP_CTIME)
1269                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATTR
1270                                 | NFS_INO_INVALID_ACCESS
1271                                 | NFS_INO_INVALID_ACL
1272                                 | NFS_INO_REVAL_FORCED);
1273
1274         /* Check if our cached file size is stale */
1275         if (fattr->valid & NFS_ATTR_FATTR_SIZE) {
1276                 new_isize = nfs_size_to_loff_t(fattr->size);
1277                 cur_isize = i_size_read(inode);
1278                 if (new_isize != cur_isize) {
1279                         /* Do we perhaps have any outstanding writes, or has
1280                          * the file grown beyond our last write? */
1281                         if (nfsi->npages == 0 || new_isize > cur_isize) {
1282                                 i_size_write(inode, new_isize);
1283                                 invalid |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_DATA;
1284                         }
1285                         dprintk("NFS: isize change on server for file %s/%ld\n",
1286                                         inode->i_sb->s_id, inode->i_ino);
1287                 }
1288         } else
1289                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATTR
1290                                 | NFS_INO_REVAL_PAGECACHE
1291                                 | NFS_INO_REVAL_FORCED);
1292
1293
1294         if (fattr->valid & NFS_ATTR_FATTR_ATIME)
1295                 memcpy(&inode->i_atime, &fattr->atime, sizeof(inode->i_atime));
1296         else if (server->caps & NFS_CAP_ATIME)
1297                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATIME
1298                                 | NFS_INO_REVAL_FORCED);
1299
1300         if (fattr->valid & NFS_ATTR_FATTR_MODE) {
1301                 if ((inode->i_mode & S_IALLUGO) != (fattr->mode & S_IALLUGO)) {
1302                         umode_t newmode = inode->i_mode & S_IFMT;
1303                         newmode |= fattr->mode & S_IALLUGO;
1304                         inode->i_mode = newmode;
1305                         invalid |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL;
1306                 }
1307         } else if (server->caps & NFS_CAP_MODE)
1308                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATTR
1309                                 | NFS_INO_INVALID_ACCESS
1310                                 | NFS_INO_INVALID_ACL
1311                                 | NFS_INO_REVAL_FORCED);
1312
1313         if (fattr->valid & NFS_ATTR_FATTR_OWNER) {
1314                 if (inode->i_uid != fattr->uid) {
1315                         invalid |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL;
1316                         inode->i_uid = fattr->uid;
1317                 }
1318         } else if (server->caps & NFS_CAP_OWNER)
1319                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATTR
1320                                 | NFS_INO_INVALID_ACCESS
1321                                 | NFS_INO_INVALID_ACL
1322                                 | NFS_INO_REVAL_FORCED);
1323
1324         if (fattr->valid & NFS_ATTR_FATTR_GROUP) {
1325                 if (inode->i_gid != fattr->gid) {
1326                         invalid |= NFS_INO_INVALID_ATTR|NFS_INO_INVALID_ACCESS|NFS_INO_INVALID_ACL;
1327                         inode->i_gid = fattr->gid;
1328                 }
1329         } else if (server->caps & NFS_CAP_OWNER_GROUP)
1330                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATTR
1331                                 | NFS_INO_INVALID_ACCESS
1332                                 | NFS_INO_INVALID_ACL
1333                                 | NFS_INO_REVAL_FORCED);
1334
1335         if (fattr->valid & NFS_ATTR_FATTR_NLINK) {
1336                 if (inode->i_nlink != fattr->nlink) {
1337                         invalid |= NFS_INO_INVALID_ATTR;
1338                         if (S_ISDIR(inode->i_mode))
1339                                 invalid |= NFS_INO_INVALID_DATA;
1340                         inode->i_nlink = fattr->nlink;
1341                 }
1342         } else if (server->caps & NFS_CAP_NLINK)
1343                 invalid |= save_cache_validity & (NFS_INO_INVALID_ATTR
1344                                 | NFS_INO_REVAL_FORCED);
1345
1346         if (fattr->valid & NFS_ATTR_FATTR_SPACE_USED) {
1347                 /*
1348                  * report the blocks in 512byte units
1349                  */
1350                 inode->i_blocks = nfs_calc_block_size(fattr->du.nfs3.used);
1351         }
1352         if (fattr->valid & NFS_ATTR_FATTR_BLOCKS_USED)
1353                 inode->i_blocks = fattr->du.nfs2.blocks;
1354
1355         /* Update attrtimeo value if we're out of the unstable period */
1356         if (invalid & NFS_INO_INVALID_ATTR) {
1357                 nfs_inc_stats(inode, NFSIOS_ATTRINVALIDATE);
1358                 nfsi->attrtimeo = NFS_MINATTRTIMEO(inode);
1359                 nfsi->attrtimeo_timestamp = now;
1360                 nfsi->attr_gencount = nfs_inc_attr_generation_counter();
1361         } else {
1362                 if (!time_in_range_open(now, nfsi->attrtimeo_timestamp, nfsi->attrtimeo_timestamp + nfsi->attrtimeo)) {
1363                         if ((nfsi->attrtimeo <<= 1) > NFS_MAXATTRTIMEO(inode))
1364                                 nfsi->attrtimeo = NFS_MAXATTRTIMEO(inode);
1365                         nfsi->attrtimeo_timestamp = now;
1366                 }
1367         }
1368         invalid &= ~NFS_INO_INVALID_ATTR;
1369         /* Don't invalidate the data if we were to blame */
1370         if (!(S_ISREG(inode->i_mode) || S_ISDIR(inode->i_mode)
1371                                 || S_ISLNK(inode->i_mode)))
1372                 invalid &= ~NFS_INO_INVALID_DATA;
1373         if (!nfs_have_delegation(inode, FMODE_READ) ||
1374                         (save_cache_validity & NFS_INO_REVAL_FORCED))
1375                 nfsi->cache_validity |= invalid;
1376
1377         return 0;
1378  out_changed:
1379         /*
1380          * Big trouble! The inode has become a different object.
1381          */
1382         printk(KERN_DEBUG "%s: inode %ld mode changed, %07o to %07o\n",
1383                         __func__, inode->i_ino, inode->i_mode, fattr->mode);
1384  out_err:
1385         /*
1386          * No need to worry about unhashing the dentry, as the
1387          * lookup validation will know that the inode is bad.
1388          * (But we fall through to invalidate the caches.)
1389          */
1390         nfs_invalidate_inode(inode);
1391         return -ESTALE;
1392
1393  out_fileid:
1394         printk(KERN_ERR "NFS: server %s error: fileid changed\n"
1395                 "fsid %s: expected fileid 0x%Lx, got 0x%Lx\n",
1396                 NFS_SERVER(inode)->nfs_client->cl_hostname, inode->i_sb->s_id,
1397                 (long long)nfsi->fileid, (long long)fattr->fileid);
1398         goto out_err;
1399 }
1400
1401
1402 #ifdef CONFIG_NFS_V4
1403
1404 /*
1405  * Clean out any remaining NFSv4 state that might be left over due
1406  * to open() calls that passed nfs_atomic_lookup, but failed to call
1407  * nfs_open().
1408  */
1409 void nfs4_evict_inode(struct inode *inode)
1410 {
1411         truncate_inode_pages(&inode->i_data, 0);
1412         end_writeback(inode);
1413         /* If we are holding a delegation, return it! */
1414         nfs_inode_return_delegation_noreclaim(inode);
1415         /* First call standard NFS clear_inode() code */
1416         nfs_clear_inode(inode);
1417 }
1418 #endif
1419
1420 struct inode *nfs_alloc_inode(struct super_block *sb)
1421 {
1422         struct nfs_inode *nfsi;
1423         nfsi = (struct nfs_inode *)kmem_cache_alloc(nfs_inode_cachep, GFP_KERNEL);
1424         if (!nfsi)
1425                 return NULL;
1426         nfsi->flags = 0UL;
1427         nfsi->cache_validity = 0UL;
1428 #ifdef CONFIG_NFS_V3_ACL
1429         nfsi->acl_access = ERR_PTR(-EAGAIN);
1430         nfsi->acl_default = ERR_PTR(-EAGAIN);
1431 #endif
1432 #ifdef CONFIG_NFS_V4
1433         nfsi->nfs4_acl = NULL;
1434 #endif /* CONFIG_NFS_V4 */
1435         return &nfsi->vfs_inode;
1436 }
1437
1438 void nfs_destroy_inode(struct inode *inode)
1439 {
1440         kmem_cache_free(nfs_inode_cachep, NFS_I(inode));
1441 }
1442
1443 static inline void nfs4_init_once(struct nfs_inode *nfsi)
1444 {
1445 #ifdef CONFIG_NFS_V4
1446         INIT_LIST_HEAD(&nfsi->open_states);
1447         nfsi->delegation = NULL;
1448         nfsi->delegation_state = 0;
1449         init_rwsem(&nfsi->rwsem);
1450 #endif
1451 }
1452
1453 static void init_once(void *foo)
1454 {
1455         struct nfs_inode *nfsi = (struct nfs_inode *) foo;
1456
1457         inode_init_once(&nfsi->vfs_inode);
1458         INIT_LIST_HEAD(&nfsi->open_files);
1459         INIT_LIST_HEAD(&nfsi->access_cache_entry_lru);
1460         INIT_LIST_HEAD(&nfsi->access_cache_inode_lru);
1461         INIT_RADIX_TREE(&nfsi->nfs_page_tree, GFP_ATOMIC);
1462         nfsi->npages = 0;
1463         nfsi->ncommit = 0;
1464         atomic_set(&nfsi->silly_count, 1);
1465         INIT_HLIST_HEAD(&nfsi->silly_list);
1466         init_waitqueue_head(&nfsi->waitqueue);
1467         nfs4_init_once(nfsi);
1468 }
1469
1470 static int __init nfs_init_inodecache(void)
1471 {
1472         nfs_inode_cachep = kmem_cache_create("nfs_inode_cache",
1473                                              sizeof(struct nfs_inode),
1474                                              0, (SLAB_RECLAIM_ACCOUNT|
1475                                                 SLAB_MEM_SPREAD),
1476                                              init_once);
1477         if (nfs_inode_cachep == NULL)
1478                 return -ENOMEM;
1479
1480         return 0;
1481 }
1482
1483 static void nfs_destroy_inodecache(void)
1484 {
1485         kmem_cache_destroy(nfs_inode_cachep);
1486 }
1487
1488 struct workqueue_struct *nfsiod_workqueue;
1489
1490 /*
1491  * start up the nfsiod workqueue
1492  */
1493 static int nfsiod_start(void)
1494 {
1495         struct workqueue_struct *wq;
1496         dprintk("RPC:       creating workqueue nfsiod\n");
1497         wq = alloc_workqueue("nfsiod", WQ_RESCUER, 0);
1498         if (wq == NULL)
1499                 return -ENOMEM;
1500         nfsiod_workqueue = wq;
1501         return 0;
1502 }
1503
1504 /*
1505  * Destroy the nfsiod workqueue
1506  */
1507 static void nfsiod_stop(void)
1508 {
1509         struct workqueue_struct *wq;
1510
1511         wq = nfsiod_workqueue;
1512         if (wq == NULL)
1513                 return;
1514         nfsiod_workqueue = NULL;
1515         destroy_workqueue(wq);
1516 }
1517
1518 /*
1519  * Initialize NFS
1520  */
1521 static int __init init_nfs_fs(void)
1522 {
1523         int err;
1524
1525         err = nfs_idmap_init();
1526         if (err < 0)
1527                 goto out9;
1528
1529         err = nfs_dns_resolver_init();
1530         if (err < 0)
1531                 goto out8;
1532
1533         err = nfs_fscache_register();
1534         if (err < 0)
1535                 goto out7;
1536
1537         err = nfsiod_start();
1538         if (err)
1539                 goto out6;
1540
1541         err = nfs_fs_proc_init();
1542         if (err)
1543                 goto out5;
1544
1545         err = nfs_init_nfspagecache();
1546         if (err)
1547                 goto out4;
1548
1549         err = nfs_init_inodecache();
1550         if (err)
1551                 goto out3;
1552
1553         err = nfs_init_readpagecache();
1554         if (err)
1555                 goto out2;
1556
1557         err = nfs_init_writepagecache();
1558         if (err)
1559                 goto out1;
1560
1561         err = nfs_init_directcache();
1562         if (err)
1563                 goto out0;
1564
1565 #ifdef CONFIG_PROC_FS
1566         rpc_proc_register(&nfs_rpcstat);
1567 #endif
1568         if ((err = register_nfs_fs()) != 0)
1569                 goto out;
1570         return 0;
1571 out:
1572 #ifdef CONFIG_PROC_FS
1573         rpc_proc_unregister("nfs");
1574 #endif
1575         nfs_destroy_directcache();
1576 out0:
1577         nfs_destroy_writepagecache();
1578 out1:
1579         nfs_destroy_readpagecache();
1580 out2:
1581         nfs_destroy_inodecache();
1582 out3:
1583         nfs_destroy_nfspagecache();
1584 out4:
1585         nfs_fs_proc_exit();
1586 out5:
1587         nfsiod_stop();
1588 out6:
1589         nfs_fscache_unregister();
1590 out7:
1591         nfs_dns_resolver_destroy();
1592 out8:
1593         nfs_idmap_quit();
1594 out9:
1595         return err;
1596 }
1597
1598 static void __exit exit_nfs_fs(void)
1599 {
1600         nfs_destroy_directcache();
1601         nfs_destroy_writepagecache();
1602         nfs_destroy_readpagecache();
1603         nfs_destroy_inodecache();
1604         nfs_destroy_nfspagecache();
1605         nfs_fscache_unregister();
1606         nfs_dns_resolver_destroy();
1607         nfs_idmap_quit();
1608 #ifdef CONFIG_PROC_FS
1609         rpc_proc_unregister("nfs");
1610 #endif
1611         unregister_nfs_fs();
1612         nfs_fs_proc_exit();
1613         nfsiod_stop();
1614 }
1615
1616 /* Not quite true; I just maintain it */
1617 MODULE_AUTHOR("Olaf Kirch <okir@monad.swb.de>");
1618 MODULE_LICENSE("GPL");
1619 module_param(enable_ino64, bool, 0644);
1620
1621 module_init(init_nfs_fs)
1622 module_exit(exit_nfs_fs)