a66ab13453738fdeb20486bb02a71d036a42ae82
[cascardo/linux.git] / include / net / request_sock.h
1 /*
2  * NET          Generic infrastructure for Network protocols.
3  *
4  *              Definitions for request_sock 
5  *
6  * Authors:     Arnaldo Carvalho de Melo <acme@conectiva.com.br>
7  *
8  *              From code originally in include/net/tcp.h
9  *
10  *              This program is free software; you can redistribute it and/or
11  *              modify it under the terms of the GNU General Public License
12  *              as published by the Free Software Foundation; either version
13  *              2 of the License, or (at your option) any later version.
14  */
15 #ifndef _REQUEST_SOCK_H
16 #define _REQUEST_SOCK_H
17
18 #include <linux/slab.h>
19 #include <linux/spinlock.h>
20 #include <linux/types.h>
21 #include <linux/bug.h>
22
23 #include <net/sock.h>
24
25 struct request_sock;
26 struct sk_buff;
27 struct dst_entry;
28 struct proto;
29
30 struct request_sock_ops {
31         int             family;
32         int             obj_size;
33         struct kmem_cache       *slab;
34         char            *slab_name;
35         int             (*rtx_syn_ack)(const struct sock *sk,
36                                        struct request_sock *req);
37         void            (*send_ack)(const struct sock *sk, struct sk_buff *skb,
38                                     struct request_sock *req);
39         void            (*send_reset)(const struct sock *sk,
40                                       struct sk_buff *skb);
41         void            (*destructor)(struct request_sock *req);
42         void            (*syn_ack_timeout)(const struct request_sock *req);
43 };
44
45 int inet_rtx_syn_ack(const struct sock *parent, struct request_sock *req);
46
47 /* struct request_sock - mini sock to represent a connection request
48  */
49 struct request_sock {
50         struct sock_common              __req_common;
51 #define rsk_refcnt                      __req_common.skc_refcnt
52 #define rsk_hash                        __req_common.skc_hash
53
54         struct request_sock             *dl_next;
55         struct sock                     *rsk_listener;
56         u16                             mss;
57         u8                              num_retrans; /* number of retransmits */
58         u8                              cookie_ts:1; /* syncookie: encode tcpopts in timestamp */
59         u8                              num_timeout:7; /* number of timeouts */
60         /* The following two fields can be easily recomputed I think -AK */
61         u32                             window_clamp; /* window clamp at creation time */
62         u32                             rcv_wnd;          /* rcv_wnd offered first time */
63         u32                             ts_recent;
64         struct timer_list               rsk_timer;
65         const struct request_sock_ops   *rsk_ops;
66         struct sock                     *sk;
67         u32                             *saved_syn;
68         u32                             secid;
69         u32                             peer_secid;
70 };
71
72 static inline struct request_sock *inet_reqsk(struct sock *sk)
73 {
74         return (struct request_sock *)sk;
75 }
76
77 static inline struct sock *req_to_sk(struct request_sock *req)
78 {
79         return (struct sock *)req;
80 }
81
82 static inline struct request_sock *
83 reqsk_alloc(const struct request_sock_ops *ops, struct sock *sk_listener)
84 {
85         struct request_sock *req = kmem_cache_alloc(ops->slab, GFP_ATOMIC);
86
87         if (req) {
88                 req->rsk_ops = ops;
89                 sock_hold(sk_listener);
90                 req->rsk_listener = sk_listener;
91                 req_to_sk(req)->sk_prot = sk_listener->sk_prot;
92                 sk_node_init(&req_to_sk(req)->sk_node);
93                 req->saved_syn = NULL;
94                 /* Following is temporary. It is coupled with debugging
95                  * helpers in reqsk_put() & reqsk_free()
96                  */
97                 atomic_set(&req->rsk_refcnt, 0);
98         }
99         return req;
100 }
101
102 static inline void reqsk_free(struct request_sock *req)
103 {
104         /* temporary debugging */
105         WARN_ON_ONCE(atomic_read(&req->rsk_refcnt) != 0);
106
107         req->rsk_ops->destructor(req);
108         if (req->rsk_listener)
109                 sock_put(req->rsk_listener);
110         kfree(req->saved_syn);
111         kmem_cache_free(req->rsk_ops->slab, req);
112 }
113
114 static inline void reqsk_put(struct request_sock *req)
115 {
116         if (atomic_dec_and_test(&req->rsk_refcnt))
117                 reqsk_free(req);
118 }
119
120 extern int sysctl_max_syn_backlog;
121
122 /*
123  * For a TCP Fast Open listener -
124  *      lock - protects the access to all the reqsk, which is co-owned by
125  *              the listener and the child socket.
126  *      qlen - pending TFO requests (still in TCP_SYN_RECV).
127  *      max_qlen - max TFO reqs allowed before TFO is disabled.
128  *
129  *      XXX (TFO) - ideally these fields can be made as part of "listen_sock"
130  *      structure above. But there is some implementation difficulty due to
131  *      listen_sock being part of request_sock_queue hence will be freed when
132  *      a listener is stopped. But TFO related fields may continue to be
133  *      accessed even after a listener is closed, until its sk_refcnt drops
134  *      to 0 implying no more outstanding TFO reqs. One solution is to keep
135  *      listen_opt around until sk_refcnt drops to 0. But there is some other
136  *      complexity that needs to be resolved. E.g., a listener can be disabled
137  *      temporarily through shutdown()->tcp_disconnect(), and re-enabled later.
138  */
139 struct fastopen_queue {
140         struct request_sock     *rskq_rst_head; /* Keep track of past TFO */
141         struct request_sock     *rskq_rst_tail; /* requests that caused RST.
142                                                  * This is part of the defense
143                                                  * against spoofing attack.
144                                                  */
145         spinlock_t      lock;
146         int             qlen;           /* # of pending (TCP_SYN_RECV) reqs */
147         int             max_qlen;       /* != 0 iff TFO is currently enabled */
148 };
149
150 /** struct request_sock_queue - queue of request_socks
151  *
152  * @rskq_accept_head - FIFO head of established children
153  * @rskq_accept_tail - FIFO tail of established children
154  * @rskq_defer_accept - User waits for some data after accept()
155  *
156  */
157 struct request_sock_queue {
158         spinlock_t              rskq_lock;
159         u8                      rskq_defer_accept;
160         u8                      max_qlen_log;
161         u32                     synflood_warned;
162         atomic_t                qlen;
163         atomic_t                young;
164
165         struct request_sock     *rskq_accept_head;
166         struct request_sock     *rskq_accept_tail;
167         struct fastopen_queue   fastopenq;  /* Check max_qlen != 0 to determine
168                                              * if TFO is enabled.
169                                              */
170 };
171
172 void reqsk_queue_alloc(struct request_sock_queue *queue,
173                        unsigned int nr_table_entries);
174
175 void reqsk_fastopen_remove(struct sock *sk, struct request_sock *req,
176                            bool reset);
177
178 static inline bool reqsk_queue_empty(const struct request_sock_queue *queue)
179 {
180         return queue->rskq_accept_head == NULL;
181 }
182
183 static inline void reqsk_queue_add(struct request_sock_queue *queue,
184                                    struct request_sock *req,
185                                    struct sock *parent,
186                                    struct sock *child)
187 {
188         spin_lock(&queue->rskq_lock);
189         req->sk = child;
190         sk_acceptq_added(parent);
191
192         if (queue->rskq_accept_head == NULL)
193                 queue->rskq_accept_head = req;
194         else
195                 queue->rskq_accept_tail->dl_next = req;
196
197         queue->rskq_accept_tail = req;
198         req->dl_next = NULL;
199         spin_unlock(&queue->rskq_lock);
200 }
201
202 static inline struct request_sock *reqsk_queue_remove(struct request_sock_queue *queue,
203                                                       struct sock *parent)
204 {
205         struct request_sock *req;
206
207         spin_lock_bh(&queue->rskq_lock);
208         req = queue->rskq_accept_head;
209         if (req) {
210                 sk_acceptq_removed(parent);
211                 queue->rskq_accept_head = req->dl_next;
212                 if (queue->rskq_accept_head == NULL)
213                         queue->rskq_accept_tail = NULL;
214         }
215         spin_unlock_bh(&queue->rskq_lock);
216         return req;
217 }
218
219 static inline void reqsk_queue_removed(struct request_sock_queue *queue,
220                                        const struct request_sock *req)
221 {
222         if (req->num_timeout == 0)
223                 atomic_dec(&queue->young);
224         atomic_dec(&queue->qlen);
225 }
226
227 static inline void reqsk_queue_added(struct request_sock_queue *queue)
228 {
229         atomic_inc(&queue->young);
230         atomic_inc(&queue->qlen);
231 }
232
233 static inline int reqsk_queue_len(const struct request_sock_queue *queue)
234 {
235         return atomic_read(&queue->qlen);
236 }
237
238 static inline int reqsk_queue_len_young(const struct request_sock_queue *queue)
239 {
240         return atomic_read(&queue->young);
241 }
242
243 static inline int reqsk_queue_is_full(const struct request_sock_queue *queue)
244 {
245         return reqsk_queue_len(queue) >> queue->max_qlen_log;
246 }
247
248 #endif /* _REQUEST_SOCK_H */