net/mlx4_en: Implement mcast loopback prevention for ETH qps
[cascardo/linux.git] / drivers / net / ethernet / mellanox / mlx4 / en_main.c
1 /*
2  * Copyright (c) 2007 Mellanox Technologies. All rights reserved.
3  *
4  * This software is available to you under a choice of one of two
5  * licenses.  You may choose to be licensed under the terms of the GNU
6  * General Public License (GPL) Version 2, available from the file
7  * COPYING in the main directory of this source tree, or the
8  * OpenIB.org BSD license below:
9  *
10  *     Redistribution and use in source and binary forms, with or
11  *     without modification, are permitted provided that the following
12  *     conditions are met:
13  *
14  *      - Redistributions of source code must retain the above
15  *        copyright notice, this list of conditions and the following
16  *        disclaimer.
17  *
18  *      - Redistributions in binary form must reproduce the above
19  *        copyright notice, this list of conditions and the following
20  *        disclaimer in the documentation and/or other materials
21  *        provided with the distribution.
22  *
23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
30  * SOFTWARE.
31  *
32  */
33
34 #include <linux/cpumask.h>
35 #include <linux/module.h>
36 #include <linux/delay.h>
37 #include <linux/netdevice.h>
38 #include <linux/slab.h>
39
40 #include <linux/mlx4/driver.h>
41 #include <linux/mlx4/device.h>
42 #include <linux/mlx4/cmd.h>
43
44 #include "mlx4_en.h"
45
46 MODULE_AUTHOR("Liran Liss, Yevgeny Petrilin");
47 MODULE_DESCRIPTION("Mellanox ConnectX HCA Ethernet driver");
48 MODULE_LICENSE("Dual BSD/GPL");
49 MODULE_VERSION(DRV_VERSION " ("DRV_RELDATE")");
50
51 static const char mlx4_en_version[] =
52         DRV_NAME ": Mellanox ConnectX HCA Ethernet driver v"
53         DRV_VERSION " (" DRV_RELDATE ")\n";
54
55 #define MLX4_EN_PARM_INT(X, def_val, desc) \
56         static unsigned int X = def_val;\
57         module_param(X , uint, 0444); \
58         MODULE_PARM_DESC(X, desc);
59
60
61 /*
62  * Device scope module parameters
63  */
64
65 /* Enable RSS UDP traffic */
66 MLX4_EN_PARM_INT(udp_rss, 1,
67                  "Enable RSS for incoming UDP traffic or disabled (0)");
68
69 /* Priority pausing */
70 MLX4_EN_PARM_INT(pfctx, 0, "Priority based Flow Control policy on TX[7:0]."
71                            " Per priority bit mask");
72 MLX4_EN_PARM_INT(pfcrx, 0, "Priority based Flow Control policy on RX[7:0]."
73                            " Per priority bit mask");
74
75 MLX4_EN_PARM_INT(inline_thold, MAX_INLINE,
76                  "Threshold for using inline data (range: 17-104, default: 104)");
77
78 #define MAX_PFC_TX     0xff
79 #define MAX_PFC_RX     0xff
80
81 void en_print(const char *level, const struct mlx4_en_priv *priv,
82               const char *format, ...)
83 {
84         va_list args;
85         struct va_format vaf;
86
87         va_start(args, format);
88
89         vaf.fmt = format;
90         vaf.va = &args;
91         if (priv->registered)
92                 printk("%s%s: %s: %pV",
93                        level, DRV_NAME, priv->dev->name, &vaf);
94         else
95                 printk("%s%s: %s: Port %d: %pV",
96                        level, DRV_NAME, dev_name(&priv->mdev->pdev->dev),
97                        priv->port, &vaf);
98         va_end(args);
99 }
100
101 void mlx4_en_update_loopback_state(struct net_device *dev,
102                                    netdev_features_t features)
103 {
104         struct mlx4_en_priv *priv = netdev_priv(dev);
105
106         if (features & NETIF_F_LOOPBACK)
107                 priv->ctrl_flags |= cpu_to_be32(MLX4_WQE_CTRL_FORCE_LOOPBACK);
108         else
109                 priv->ctrl_flags &= cpu_to_be32(~MLX4_WQE_CTRL_FORCE_LOOPBACK);
110
111         priv->flags &= ~(MLX4_EN_FLAG_RX_FILTER_NEEDED|
112                         MLX4_EN_FLAG_ENABLE_HW_LOOPBACK);
113
114         /* Drop the packet if SRIOV is not enabled
115          * and not performing the selftest or flb disabled
116          */
117         if (mlx4_is_mfunc(priv->mdev->dev) &&
118             !(features & NETIF_F_LOOPBACK) && !priv->validate_loopback)
119                 priv->flags |= MLX4_EN_FLAG_RX_FILTER_NEEDED;
120
121         /* Set dmac in Tx WQE if we are in SRIOV mode or if loopback selftest
122          * is requested
123          */
124         if (mlx4_is_mfunc(priv->mdev->dev) || priv->validate_loopback)
125                 priv->flags |= MLX4_EN_FLAG_ENABLE_HW_LOOPBACK;
126
127         mutex_lock(&priv->mdev->state_lock);
128         if (priv->mdev->dev->caps.flags2 &
129             MLX4_DEV_CAP_FLAG2_UPDATE_QP_SRC_CHECK_LB &&
130             priv->rss_map.indir_qp.qpn) {
131                 int i;
132                 int err = 0;
133                 int loopback = !!(features & NETIF_F_LOOPBACK);
134
135                 for (i = 0; i < priv->rx_ring_num; i++) {
136                         int ret;
137
138                         ret = mlx4_en_change_mcast_lb(priv,
139                                                       &priv->rss_map.qps[i],
140                                                       loopback);
141                         if (!err)
142                                 err = ret;
143                 }
144                 if (err)
145                         mlx4_warn(priv->mdev, "failed to change mcast loopback\n");
146         }
147         mutex_unlock(&priv->mdev->state_lock);
148 }
149
150 static int mlx4_en_get_profile(struct mlx4_en_dev *mdev)
151 {
152         struct mlx4_en_profile *params = &mdev->profile;
153         int i;
154
155         params->udp_rss = udp_rss;
156         params->num_tx_rings_p_up = mlx4_low_memory_profile() ?
157                 MLX4_EN_MIN_TX_RING_P_UP :
158                 min_t(int, num_online_cpus(), MLX4_EN_MAX_TX_RING_P_UP);
159
160         if (params->udp_rss && !(mdev->dev->caps.flags
161                                         & MLX4_DEV_CAP_FLAG_UDP_RSS)) {
162                 mlx4_warn(mdev, "UDP RSS is not supported on this device\n");
163                 params->udp_rss = 0;
164         }
165         for (i = 1; i <= MLX4_MAX_PORTS; i++) {
166                 params->prof[i].rx_pause = 1;
167                 params->prof[i].rx_ppp = pfcrx;
168                 params->prof[i].tx_pause = 1;
169                 params->prof[i].tx_ppp = pfctx;
170                 params->prof[i].tx_ring_size = MLX4_EN_DEF_TX_RING_SIZE;
171                 params->prof[i].rx_ring_size = MLX4_EN_DEF_RX_RING_SIZE;
172                 params->prof[i].tx_ring_num = params->num_tx_rings_p_up *
173                         MLX4_EN_NUM_UP;
174                 params->prof[i].rss_rings = 0;
175                 params->prof[i].inline_thold = inline_thold;
176         }
177
178         return 0;
179 }
180
181 static void *mlx4_en_get_netdev(struct mlx4_dev *dev, void *ctx, u8 port)
182 {
183         struct mlx4_en_dev *endev = ctx;
184
185         return endev->pndev[port];
186 }
187
188 static void mlx4_en_event(struct mlx4_dev *dev, void *endev_ptr,
189                           enum mlx4_dev_event event, unsigned long port)
190 {
191         struct mlx4_en_dev *mdev = (struct mlx4_en_dev *) endev_ptr;
192         struct mlx4_en_priv *priv;
193
194         switch (event) {
195         case MLX4_DEV_EVENT_PORT_UP:
196         case MLX4_DEV_EVENT_PORT_DOWN:
197                 if (!mdev->pndev[port])
198                         return;
199                 priv = netdev_priv(mdev->pndev[port]);
200                 /* To prevent races, we poll the link state in a separate
201                   task rather than changing it here */
202                 priv->link_state = event;
203                 queue_work(mdev->workqueue, &priv->linkstate_task);
204                 break;
205
206         case MLX4_DEV_EVENT_CATASTROPHIC_ERROR:
207                 mlx4_err(mdev, "Internal error detected, restarting device\n");
208                 break;
209
210         case MLX4_DEV_EVENT_SLAVE_INIT:
211         case MLX4_DEV_EVENT_SLAVE_SHUTDOWN:
212                 break;
213         default:
214                 if (port < 1 || port > dev->caps.num_ports ||
215                     !mdev->pndev[port])
216                         return;
217                 mlx4_warn(mdev, "Unhandled event %d for port %d\n", event,
218                           (int) port);
219         }
220 }
221
222 static void mlx4_en_remove(struct mlx4_dev *dev, void *endev_ptr)
223 {
224         struct mlx4_en_dev *mdev = endev_ptr;
225         int i;
226
227         mutex_lock(&mdev->state_lock);
228         mdev->device_up = false;
229         mutex_unlock(&mdev->state_lock);
230
231         mlx4_foreach_port(i, dev, MLX4_PORT_TYPE_ETH)
232                 if (mdev->pndev[i])
233                         mlx4_en_destroy_netdev(mdev->pndev[i]);
234
235         if (mdev->dev->caps.flags2 & MLX4_DEV_CAP_FLAG2_TS)
236                 mlx4_en_remove_timestamp(mdev);
237
238         flush_workqueue(mdev->workqueue);
239         destroy_workqueue(mdev->workqueue);
240         (void) mlx4_mr_free(dev, &mdev->mr);
241         iounmap(mdev->uar_map);
242         mlx4_uar_free(dev, &mdev->priv_uar);
243         mlx4_pd_free(dev, mdev->priv_pdn);
244         if (mdev->nb.notifier_call)
245                 unregister_netdevice_notifier(&mdev->nb);
246         kfree(mdev);
247 }
248
249 static void mlx4_en_activate(struct mlx4_dev *dev, void *ctx)
250 {
251         int i;
252         struct mlx4_en_dev *mdev = ctx;
253
254         /* Create a netdev for each port */
255         mlx4_foreach_port(i, dev, MLX4_PORT_TYPE_ETH) {
256                 mlx4_info(mdev, "Activating port:%d\n", i);
257                 if (mlx4_en_init_netdev(mdev, i, &mdev->profile.prof[i]))
258                         mdev->pndev[i] = NULL;
259         }
260
261         /* register notifier */
262         mdev->nb.notifier_call = mlx4_en_netdev_event;
263         if (register_netdevice_notifier(&mdev->nb)) {
264                 mdev->nb.notifier_call = NULL;
265                 mlx4_err(mdev, "Failed to create notifier\n");
266         }
267 }
268
269 static void *mlx4_en_add(struct mlx4_dev *dev)
270 {
271         struct mlx4_en_dev *mdev;
272         int i;
273
274         printk_once(KERN_INFO "%s", mlx4_en_version);
275
276         mdev = kzalloc(sizeof(*mdev), GFP_KERNEL);
277         if (!mdev)
278                 goto err_free_res;
279
280         if (mlx4_pd_alloc(dev, &mdev->priv_pdn))
281                 goto err_free_dev;
282
283         if (mlx4_uar_alloc(dev, &mdev->priv_uar))
284                 goto err_pd;
285
286         mdev->uar_map = ioremap((phys_addr_t) mdev->priv_uar.pfn << PAGE_SHIFT,
287                                 PAGE_SIZE);
288         if (!mdev->uar_map)
289                 goto err_uar;
290         spin_lock_init(&mdev->uar_lock);
291
292         mdev->dev = dev;
293         mdev->dma_device = &dev->persist->pdev->dev;
294         mdev->pdev = dev->persist->pdev;
295         mdev->device_up = false;
296
297         mdev->LSO_support = !!(dev->caps.flags & (1 << 15));
298         if (!mdev->LSO_support)
299                 mlx4_warn(mdev, "LSO not supported, please upgrade to later FW version to enable LSO\n");
300
301         if (mlx4_mr_alloc(mdev->dev, mdev->priv_pdn, 0, ~0ull,
302                          MLX4_PERM_LOCAL_WRITE |  MLX4_PERM_LOCAL_READ,
303                          0, 0, &mdev->mr)) {
304                 mlx4_err(mdev, "Failed allocating memory region\n");
305                 goto err_map;
306         }
307         if (mlx4_mr_enable(mdev->dev, &mdev->mr)) {
308                 mlx4_err(mdev, "Failed enabling memory region\n");
309                 goto err_mr;
310         }
311
312         /* Build device profile according to supplied module parameters */
313         if (mlx4_en_get_profile(mdev)) {
314                 mlx4_err(mdev, "Bad module parameters, aborting\n");
315                 goto err_mr;
316         }
317
318         /* Configure which ports to start according to module parameters */
319         mdev->port_cnt = 0;
320         mlx4_foreach_port(i, dev, MLX4_PORT_TYPE_ETH)
321                 mdev->port_cnt++;
322
323         /* Initialize time stamp mechanism */
324         if (mdev->dev->caps.flags2 & MLX4_DEV_CAP_FLAG2_TS)
325                 mlx4_en_init_timestamp(mdev);
326
327         /* Set default number of RX rings*/
328         mlx4_en_set_num_rx_rings(mdev);
329
330         /* Create our own workqueue for reset/multicast tasks
331          * Note: we cannot use the shared workqueue because of deadlocks caused
332          *       by the rtnl lock */
333         mdev->workqueue = create_singlethread_workqueue("mlx4_en");
334         if (!mdev->workqueue)
335                 goto err_mr;
336
337         /* At this stage all non-port specific tasks are complete:
338          * mark the card state as up */
339         mutex_init(&mdev->state_lock);
340         mdev->device_up = true;
341
342         return mdev;
343
344 err_mr:
345         (void) mlx4_mr_free(dev, &mdev->mr);
346 err_map:
347         if (mdev->uar_map)
348                 iounmap(mdev->uar_map);
349 err_uar:
350         mlx4_uar_free(dev, &mdev->priv_uar);
351 err_pd:
352         mlx4_pd_free(dev, mdev->priv_pdn);
353 err_free_dev:
354         kfree(mdev);
355 err_free_res:
356         return NULL;
357 }
358
359 static struct mlx4_interface mlx4_en_interface = {
360         .add            = mlx4_en_add,
361         .remove         = mlx4_en_remove,
362         .event          = mlx4_en_event,
363         .get_dev        = mlx4_en_get_netdev,
364         .protocol       = MLX4_PROT_ETH,
365         .activate       = mlx4_en_activate,
366 };
367
368 static void mlx4_en_verify_params(void)
369 {
370         if (pfctx > MAX_PFC_TX) {
371                 pr_warn("mlx4_en: WARNING: illegal module parameter pfctx 0x%x - should be in range 0-0x%x, will be changed to default (0)\n",
372                         pfctx, MAX_PFC_TX);
373                 pfctx = 0;
374         }
375
376         if (pfcrx > MAX_PFC_RX) {
377                 pr_warn("mlx4_en: WARNING: illegal module parameter pfcrx 0x%x - should be in range 0-0x%x, will be changed to default (0)\n",
378                         pfcrx, MAX_PFC_RX);
379                 pfcrx = 0;
380         }
381
382         if (inline_thold < MIN_PKT_LEN || inline_thold > MAX_INLINE) {
383                 pr_warn("mlx4_en: WARNING: illegal module parameter inline_thold %d - should be in range %d-%d, will be changed to default (%d)\n",
384                         inline_thold, MIN_PKT_LEN, MAX_INLINE, MAX_INLINE);
385                 inline_thold = MAX_INLINE;
386         }
387 }
388
389 static int __init mlx4_en_init(void)
390 {
391         mlx4_en_verify_params();
392
393         return mlx4_register_interface(&mlx4_en_interface);
394 }
395
396 static void __exit mlx4_en_cleanup(void)
397 {
398         mlx4_unregister_interface(&mlx4_en_interface);
399 }
400
401 module_init(mlx4_en_init);
402 module_exit(mlx4_en_cleanup);
403