metaflow: Allow fields to be marked as variable length.
[cascardo/ovs.git] / build-aux / extract-ofp-fields
1 #! /usr/bin/python
2
3 import sys
4 import os.path
5 import re
6
7 line = ""
8
9 # Maps from user-friendly version number to its protocol encoding.
10 VERSION = {"1.0": 0x01,
11            "1.1": 0x02,
12            "1.2": 0x03,
13            "1.3": 0x04,
14            "1.4": 0x05,
15            "1.5": 0x06}
16
17 TYPES = {"u8":   (1, False),
18          "be16": (2, False),
19          "be32": (4, False),
20          "MAC":  (6, False),
21          "be64": (8, False),
22          "IPv6": (16, False)}
23
24 FORMATTING = {"decimal":            ("MFS_DECIMAL",      1,   8),
25               "hexadecimal":        ("MFS_HEXADECIMAL",  1, 127),
26               "Ethernet":           ("MFS_ETHERNET",     6,   6),
27               "IPv4":               ("MFS_IPV4",         4,   4),
28               "IPv6":               ("MFS_IPV6",        16,  16),
29               "OpenFlow 1.0 port":  ("MFS_OFP_PORT",     2,   2),
30               "OpenFlow 1.1+ port": ("MFS_OFP_PORT_OXM", 4,   4),
31               "frag":               ("MFS_FRAG",         1,   1),
32               "tunnel flags":       ("MFS_TNL_FLAGS",    2,   2),
33               "TCP flags":          ("MFS_TCP_FLAGS",    2,   2)}
34
35 PREREQS = {"none": "MFP_NONE",
36            "ARP": "MFP_ARP",
37            "VLAN VID": "MFP_VLAN_VID",
38            "IPv4": "MFP_IPV4",
39            "IPv6": "MFP_IPV6",
40            "IPv4/IPv6": "MFP_IP_ANY",
41            "MPLS": "MFP_MPLS",
42            "TCP": "MFP_TCP",
43            "UDP": "MFP_UDP",
44            "SCTP": "MFP_SCTP",
45            "ICMPv4": "MFP_ICMPV4",
46            "ICMPv6": "MFP_ICMPV6",
47            "ND": "MFP_ND",
48            "ND solicit": "MFP_ND_SOLICIT",
49            "ND advert": "MFP_ND_ADVERT"}
50
51 # Maps a name prefix into an (experimenter ID, class) pair, so:
52 #
53 #      - Standard OXM classes are written as (0, <oxm_class>)
54 #
55 #      - Experimenter OXM classes are written as (<oxm_vender>, 0xffff)
56 #
57 # If a name matches more than one prefix, the longest one is used.
58 OXM_CLASSES = {"NXM_OF_":        (0,          0x0000),
59                "NXM_NX_":        (0,          0x0001),
60                "OXM_OF_":        (0,          0x8000),
61                "OXM_OF_PKT_REG": (0,          0x8001),
62                "ONFOXM_ET_":     (0x4f4e4600, 0xffff),
63
64                # This is the experimenter OXM class for Nicira, which is the
65                # one that OVS would be using instead of NXM_OF_ and NXM_NX_
66                # if OVS didn't have those grandfathered in.  It is currently
67                # used only to test support for experimenter OXM, since there
68                # are barely any real uses of experimenter OXM in the wild.
69                "NXOXM_ET_":      (0x00002320, 0xffff)}
70
71
72 def oxm_name_to_class(name):
73     prefix = ''
74     class_ = None
75     for p, c in OXM_CLASSES.items():
76         if name.startswith(p) and len(p) > len(prefix):
77             prefix = p
78             class_ = c
79     return class_
80
81
82 def decode_version_range(range):
83     if range in VERSION:
84         return (VERSION[range], VERSION[range])
85     elif range.endswith('+'):
86         return (VERSION[range[:-1]], max(VERSION.values()))
87     else:
88         a, b = re.match(r'^([^-]+)-([^-]+)$', range).groups()
89         return (VERSION[a], VERSION[b])
90
91
92 def get_line():
93     global line
94     global line_number
95     line = input_file.readline()
96     line_number += 1
97     if line == "":
98         fatal("unexpected end of input")
99
100
101 n_errors = 0
102
103
104 def error(msg):
105     global n_errors
106     sys.stderr.write("%s:%d: %s\n" % (file_name, line_number, msg))
107     n_errors += 1
108
109
110 def fatal(msg):
111     error(msg)
112     sys.exit(1)
113
114
115 def usage():
116     argv0 = os.path.basename(sys.argv[0])
117     print('''\
118 %(argv0)s, for extracting OpenFlow field properties from meta-flow.h
119 usage: %(argv0)s INPUT [--meta-flow | --nx-match]
120   where INPUT points to lib/meta-flow.h in the source directory.
121 Depending on the option given, the output written to stdout is intended to be
122 saved either as lib/meta-flow.inc or lib/nx-match.inc for the respective C
123 file to #include.\
124 ''' % {"argv0": argv0})
125     sys.exit(0)
126
127
128 def make_sizeof(s):
129     m = re.match(r'(.*) up to (.*)', s)
130     if m:
131         struct, member = m.groups()
132         return "offsetof(%s, %s)" % (struct, member)
133     else:
134         return "sizeof(%s)" % s
135
136
137 def parse_oxms(s, prefix, n_bytes):
138     if s == 'none':
139         return ()
140
141     return tuple(parse_oxm(s2.strip(), prefix, n_bytes) for s2 in s.split(','))
142
143
144 match_types = dict()
145
146
147 def parse_oxm(s, prefix, n_bytes):
148     global match_types
149
150     m = re.match('([A-Z0-9_]+)\(([0-9]+)\) since(?: OF(1\.[0-9]+) and)? v([12]\.[0-9]+)$', s)
151     if not m:
152         fatal("%s: syntax error parsing %s" % (s, prefix))
153
154     name, oxm_type, of_version, ovs_version = m.groups()
155
156     class_ = oxm_name_to_class(name)
157     if class_ is None:
158         fatal("unknown OXM class for %s" % name)
159     oxm_vendor, oxm_class = class_
160
161     if class_ in match_types:
162         if oxm_type in match_types[class_]:
163             fatal("duplicate match type for %s (conflicts with %s)" %
164                   (name, match_types[class_][oxm_type]))
165     else:
166         match_types[class_] = dict()
167     match_types[class_][oxm_type] = name
168
169     # Normally the oxm_length is the size of the field, but for experimenter
170     # OXMs oxm_length also includes the 4-byte experimenter ID.
171     oxm_length = n_bytes
172     if oxm_class == 0xffff:
173         oxm_length += 4
174
175     header = ("NXM_HEADER(0x%x,0x%x,%s,0,%d)"
176               % (oxm_vendor, oxm_class, oxm_type, oxm_length))
177
178     if of_version:
179         if of_version not in VERSION:
180             fatal("%s: unknown OpenFlow version %s" % (name, of_version))
181         of_version_nr = VERSION[of_version]
182         if of_version_nr < VERSION['1.2']:
183             fatal("%s: claimed version %s predates OXM" % (name, of_version))
184     else:
185         of_version_nr = 0
186
187     return (header, name, of_version_nr, ovs_version)
188
189
190 def parse_field(mff, comment):
191     f = {'mff': mff}
192
193     # First line of comment is the field name.
194     m = re.match(r'"([^"]+)"(?:\s+\(aka "([^"]+)"\))?(?:\s+\(.*\))?\.', comment[0])
195     if not m:
196         fatal("%s lacks field name" % mff)
197     f['name'], f['extra_name'] = m.groups()
198
199     # Find the last blank line the comment.  The field definitions
200     # start after that.
201     blank = None
202     for i in range(len(comment)):
203         if not comment[i]:
204             blank = i
205     if not blank:
206         fatal("%s: missing blank line in comment" % mff)
207
208     d = {}
209     for key in ("Type", "Maskable", "Formatting", "Prerequisites",
210                 "Access", "Prefix lookup member",
211                 "OXM", "NXM", "OF1.0", "OF1.1"):
212         d[key] = None
213     for fline in comment[blank + 1:]:
214         m = re.match(r'([^:]+):\s+(.*)\.$', fline)
215         if not m:
216             fatal("%s: syntax error parsing key-value pair as part of %s"
217                   % (fline, mff))
218         key, value = m.groups()
219         if key not in d:
220             fatal("%s: unknown key" % key)
221         elif key == 'Code point':
222             d[key] += [value]
223         elif d[key] is not None:
224             fatal("%s: duplicate key" % key)
225         d[key] = value
226     for key, value in d.items():
227         if not value and key not in ("OF1.0", "OF1.1",
228                                      "Prefix lookup member", "Notes"):
229             fatal("%s: missing %s" % (mff, key))
230
231     m = re.match(r'([a-zA-Z0-9]+)(?: \(low ([0-9]+) bits\))?$', d['Type'])
232     if not m:
233         fatal("%s: syntax error in type" % mff)
234     type_ = m.group(1)
235     if type_ not in TYPES:
236         fatal("%s: unknown type %s" % (mff, d['Type']))
237
238     f['n_bytes'] = TYPES[type_][0]
239     if m.group(2):
240         f['n_bits'] = int(m.group(2))
241         if f['n_bits'] > f['n_bytes'] * 8:
242             fatal("%s: more bits (%d) than field size (%d)"
243                   % (mff, f['n_bits'], 8 * f['n_bytes']))
244     else:
245         f['n_bits'] = 8 * f['n_bytes']
246     f['variable'] = TYPES[type_][1]
247
248     if d['Maskable'] == 'no':
249         f['mask'] = 'MFM_NONE'
250     elif d['Maskable'] == 'bitwise':
251         f['mask'] = 'MFM_FULLY'
252     else:
253         fatal("%s: unknown maskable %s" % (mff, d['Maskable']))
254
255     fmt = FORMATTING.get(d['Formatting'])
256     if not fmt:
257         fatal("%s: unknown format %s" % (mff, d['Formatting']))
258     if f['n_bytes'] < fmt[1] or f['n_bytes'] > fmt[2]:
259         fatal("%s: %d-byte field can't be formatted as %s"
260               % (mff, f['n_bytes'], d['Formatting']))
261     f['string'] = fmt[0]
262
263     f['prereqs'] = PREREQS.get(d['Prerequisites'])
264     if not f['prereqs']:
265         fatal("%s: unknown prerequisites %s" % (mff, d['Prerequisites']))
266
267     if d['Access'] == 'read-only':
268         f['writable'] = False
269     elif d['Access'] == 'read/write':
270         f['writable'] = True
271     else:
272         fatal("%s: unknown access %s" % (mff, d['Access']))
273
274     f['OF1.0'] = d['OF1.0']
275     if not d['OF1.0'] in (None, 'exact match', 'CIDR mask'):
276         fatal("%s: unknown OF1.0 match type %s" % (mff, d['OF1.0']))
277
278     f['OF1.1'] = d['OF1.1']
279     if not d['OF1.1'] in (None, 'exact match', 'bitwise mask'):
280         fatal("%s: unknown OF1.1 match type %s" % (mff, d['OF1.1']))
281
282     f['OXM'] = (parse_oxms(d['OXM'], 'OXM', f['n_bytes']) +
283                 parse_oxms(d['NXM'], 'NXM', f['n_bytes']))
284
285     f['prefix'] = d["Prefix lookup member"]
286
287     return f
288
289
290 def protocols_to_c(protocols):
291     if protocols == set(['of10', 'of11', 'oxm']):
292         return 'OFPUTIL_P_ANY'
293     elif protocols == set(['of11', 'oxm']):
294         return 'OFPUTIL_P_NXM_OF11_UP'
295     elif protocols == set(['oxm']):
296         return 'OFPUTIL_P_NXM_OXM_ANY'
297     elif protocols == set([]):
298         return 'OFPUTIL_P_NONE'
299     else:
300         assert False
301
302
303 def make_meta_flow(fields):
304     output = []
305     for f in fields:
306         output += ["{"]
307         output += ["    %s," % f['mff']]
308         if f['extra_name']:
309             output += ["    \"%s\", \"%s\"," % (f['name'], f['extra_name'])]
310         else:
311             output += ["    \"%s\", NULL," % f['name']]
312
313         if f['variable']:
314             variable = 'true'
315         else:
316             variable = 'false'
317         output += ["    %d, %d, %s," % (f['n_bytes'], f['n_bits'], variable)]
318
319         if f['writable']:
320             rw = 'true'
321         else:
322             rw = 'false'
323         output += ["    %s, %s, %s, %s,"
324                    % (f['mask'], f['string'], f['prereqs'], rw)]
325
326         oxm = f['OXM']
327         of10 = f['OF1.0']
328         of11 = f['OF1.1']
329         if f['mff'] in ('MFF_DL_VLAN', 'MFF_DL_VLAN_PCP'):
330             # MFF_DL_VLAN and MFF_DL_VLAN_PCP don't exactly correspond to
331             # OF1.1, nor do they have NXM or OXM assignments, but their
332             # meanings can be expressed in every protocol, which is the goal of
333             # this member.
334             protocols = set(["of10", "of11", "oxm"])
335         else:
336             protocols = set([])
337             if of10:
338                 protocols |= set(["of10"])
339             if of11:
340                 protocols |= set(["of11"])
341             if oxm:
342                 protocols |= set(["oxm"])
343
344         if f['mask'] == 'MFM_FULLY':
345             cidr_protocols = protocols.copy()
346             bitwise_protocols = protocols.copy()
347
348             if of10 == 'exact match':
349                 bitwise_protocols -= set(['of10'])
350                 cidr_protocols -= set(['of10'])
351             elif of10 == 'CIDR mask':
352                 bitwise_protocols -= set(['of10'])
353             else:
354                 assert of10 is None
355
356             if of11 == 'exact match':
357                 bitwise_protocols -= set(['of11'])
358                 cidr_protocols -= set(['of11'])
359             else:
360                 assert of11 in (None, 'bitwise mask')
361         else:
362             assert f['mask'] == 'MFM_NONE'
363             cidr_protocols = set([])
364             bitwise_protocols = set([])
365
366         output += ["    %s," % protocols_to_c(protocols)]
367         output += ["    %s," % protocols_to_c(cidr_protocols)]
368         output += ["    %s," % protocols_to_c(bitwise_protocols)]
369
370         if f['prefix']:
371             output += ["    FLOW_U32OFS(%s)," % f['prefix']]
372         else:
373             output += ["    -1, /* not usable for prefix lookup */"]
374
375         output += ["},"]
376     return output
377
378
379 def make_nx_match(fields):
380     output = []
381     print("static struct nxm_field_index all_nxm_fields[] = {")
382     for f in fields:
383         # Sort by OpenFlow version number (nx-match.c depends on this).
384         for oxm in sorted(f['OXM'], key=lambda x: x[2]):
385             print("""{ .nf = { %s, %d, "%s", %s } },""" % (
386                 oxm[0], oxm[2], oxm[1], f['mff']))
387     print("};")
388     return output
389
390
391 def extract_ofp_fields(mode):
392     global line
393
394     fields = []
395
396     while True:
397         get_line()
398         if re.match('enum.*mf_field_id', line):
399             break
400
401     while True:
402         get_line()
403         first_line_number = line_number
404         here = '%s:%d' % (file_name, line_number)
405         if (line.startswith('/*')
406             or line.startswith(' *')
407             or line.startswith('#')
408             or not line
409             or line.isspace()):
410             continue
411         elif re.match('}', line) or re.match('\s+MFF_N_IDS', line):
412             break
413
414         # Parse the comment preceding an MFF_ constant into 'comment',
415         # one line to an array element.
416         line = line.strip()
417         if not line.startswith('/*'):
418             fatal("unexpected syntax between fields")
419         line = line[1:]
420         comment = []
421         end = False
422         while not end:
423             line = line.strip()
424             if line.startswith('*/'):
425                 get_line()
426                 break
427             if not line.startswith('*'):
428                 fatal("unexpected syntax within field")
429
430             line = line[1:]
431             if line.startswith(' '):
432                 line = line[1:]
433             if line.startswith(' ') and comment:
434                 continuation = True
435                 line = line.lstrip()
436             else:
437                 continuation = False
438
439             if line.endswith('*/'):
440                 line = line[:-2].rstrip()
441                 end = True
442             else:
443                 end = False
444
445             if continuation:
446                 comment[-1] += " " + line
447             else:
448                 comment += [line]
449             get_line()
450
451         # Drop blank lines at each end of comment.
452         while comment and not comment[0]:
453             comment = comment[1:]
454         while comment and not comment[-1]:
455             comment = comment[:-1]
456
457         # Parse the MFF_ constant(s).
458         mffs = []
459         while True:
460             m = re.match('\s+(MFF_[A-Z0-9_]+),?\s?$', line)
461             if not m:
462                 break
463             mffs += [m.group(1)]
464             get_line()
465         if not mffs:
466             fatal("unexpected syntax looking for MFF_ constants")
467
468         if len(mffs) > 1 or '<N>' in comment[0]:
469             for mff in mffs:
470                 # Extract trailing integer.
471                 m = re.match('.*[^0-9]([0-9]+)$', mff)
472                 if not m:
473                     fatal("%s lacks numeric suffix in register group" % mff)
474                 n = m.group(1)
475
476                 # Search-and-replace <N> within the comment,
477                 # and drop lines that have <x> for x != n.
478                 instance = []
479                 for x in comment:
480                     y = x.replace('<N>', n)
481                     if re.search('<[0-9]+>', y):
482                         if ('<%s>' % n) not in y:
483                             continue
484                         y = re.sub('<[0-9]+>', '', y)
485                     instance += [y.strip()]
486                 fields += [parse_field(mff, instance)]
487         else:
488             fields += [parse_field(mffs[0], comment)]
489         continue
490
491     input_file.close()
492
493     if n_errors:
494         sys.exit(1)
495
496     print("""\
497 /* Generated automatically; do not modify!    "-*- buffer-read-only: t -*- */
498 """)
499
500     if mode == '--meta-flow':
501         output = make_meta_flow(fields)
502     elif mode == '--nx-match':
503         output = make_nx_match(fields)
504     else:
505         assert False
506
507     return output
508
509
510 if __name__ == '__main__':
511     if '--help' in sys.argv:
512         usage()
513     elif len(sys.argv) != 3:
514         sys.stderr.write("exactly two arguments required; "
515                          "use --help for help\n")
516         sys.exit(1)
517     elif sys.argv[2] in ('--meta-flow', '--nx-match'):
518         global file_name
519         global input_file
520         global line_number
521         file_name = sys.argv[1]
522         input_file = open(file_name)
523         line_number = 0
524
525         for oline in extract_ofp_fields(sys.argv[2]):
526             print(oline)
527     else:
528         sys.stderr.write("invalid arguments; use --help for help\n")
529         sys.exit(1)