ofproto-dpif: Use a single underlying datapath across multiple bridges.
[openvswitch] / vswitchd / bridge.c
1 /* Copyright (c) 2008, 2009, 2010, 2011, 2012 Nicira, Inc.
2  *
3  * Licensed under the Apache License, Version 2.0 (the "License");
4  * you may not use this file except in compliance with the License.
5  * You may obtain a copy of the License at:
6  *
7  *     http://www.apache.org/licenses/LICENSE-2.0
8  *
9  * Unless required by applicable law or agreed to in writing, software
10  * distributed under the License is distributed on an "AS IS" BASIS,
11  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12  * See the License for the specific language governing permissions and
13  * limitations under the License.
14  */
15
16 #include <config.h>
17 #include "bridge.h"
18 #include <assert.h>
19 #include <errno.h>
20 #include <inttypes.h>
21 #include <stdlib.h>
22 #include "bitmap.h"
23 #include "bond.h"
24 #include "cfm.h"
25 #include "coverage.h"
26 #include "daemon.h"
27 #include "dirs.h"
28 #include "dynamic-string.h"
29 #include "hash.h"
30 #include "hmap.h"
31 #include "hmapx.h"
32 #include "jsonrpc.h"
33 #include "lacp.h"
34 #include "list.h"
35 #include "mac-learning.h"
36 #include "meta-flow.h"
37 #include "netdev.h"
38 #include "ofp-print.h"
39 #include "ofpbuf.h"
40 #include "ofproto/ofproto.h"
41 #include "poll-loop.h"
42 #include "sha1.h"
43 #include "shash.h"
44 #include "smap.h"
45 #include "socket-util.h"
46 #include "stream.h"
47 #include "stream-ssl.h"
48 #include "sset.h"
49 #include "system-stats.h"
50 #include "timeval.h"
51 #include "util.h"
52 #include "unixctl.h"
53 #include "vlandev.h"
54 #include "lib/vswitch-idl.h"
55 #include "xenserver.h"
56 #include "vlog.h"
57 #include "sflow_api.h"
58 #include "vlan-bitmap.h"
59
60 VLOG_DEFINE_THIS_MODULE(bridge);
61
62 COVERAGE_DEFINE(bridge_reconfigure);
63
64 /* Configuration of an uninstantiated iface. */
65 struct if_cfg {
66     struct hmap_node hmap_node;         /* Node in bridge's if_cfg_todo. */
67     const struct ovsrec_interface *cfg; /* Interface record. */
68     const struct ovsrec_port *parent;   /* Parent port record. */
69     int64_t ofport;                     /* Requested OpenFlow port number. */
70 };
71
72 /* OpenFlow port slated for removal from ofproto. */
73 struct ofpp_garbage {
74     struct list list_node;      /* Node in bridge's ofpp_garbage. */
75     uint16_t ofp_port;          /* Port to be deleted. */
76 };
77
78 struct iface {
79     /* These members are always valid. */
80     struct list port_elem;      /* Element in struct port's "ifaces" list. */
81     struct hmap_node name_node; /* In struct bridge's "iface_by_name" hmap. */
82     struct port *port;          /* Containing port. */
83     char *name;                 /* Host network device name. */
84
85     /* These members are valid only after bridge_reconfigure() causes them to
86      * be initialized. */
87     struct hmap_node ofp_port_node; /* In struct bridge's "ifaces" hmap. */
88     int ofp_port;               /* OpenFlow port number, -1 if unknown. */
89     struct netdev *netdev;      /* Network device. */
90     const char *type;           /* Usually same as cfg->type. */
91     const struct ovsrec_interface *cfg;
92 };
93
94 struct mirror {
95     struct uuid uuid;           /* UUID of this "mirror" record in database. */
96     struct hmap_node hmap_node; /* In struct bridge's "mirrors" hmap. */
97     struct bridge *bridge;
98     char *name;
99     const struct ovsrec_mirror *cfg;
100 };
101
102 struct port {
103     struct hmap_node hmap_node; /* Element in struct bridge's "ports" hmap. */
104     struct bridge *bridge;
105     char *name;
106
107     const struct ovsrec_port *cfg;
108
109     /* An ordinary bridge port has 1 interface.
110      * A bridge port for bonding has at least 2 interfaces. */
111     struct list ifaces;         /* List of "struct iface"s. */
112 };
113
114 struct bridge {
115     struct hmap_node node;      /* In 'all_bridges'. */
116     char *name;                 /* User-specified arbitrary name. */
117     char *type;                 /* Datapath type. */
118     uint8_t ea[ETH_ADDR_LEN];   /* Bridge Ethernet Address. */
119     uint8_t default_ea[ETH_ADDR_LEN]; /* Default MAC. */
120     const struct ovsrec_bridge *cfg;
121
122     /* OpenFlow switch processing. */
123     struct ofproto *ofproto;    /* OpenFlow switch. */
124
125     /* Bridge ports. */
126     struct hmap ports;          /* "struct port"s indexed by name. */
127     struct hmap ifaces;         /* "struct iface"s indexed by ofp_port. */
128     struct hmap iface_by_name;  /* "struct iface"s indexed by name. */
129
130     struct list ofpp_garbage;   /* "struct ofpp_garbage" slated for removal. */
131     struct hmap if_cfg_todo;    /* "struct if_cfg"s slated for creation.
132                                    Indexed on 'cfg->name'. */
133
134     /* Port mirroring. */
135     struct hmap mirrors;        /* "struct mirror" indexed by UUID. */
136
137     /* Synthetic local port if necessary. */
138     struct ovsrec_port synth_local_port;
139     struct ovsrec_interface synth_local_iface;
140     struct ovsrec_interface *synth_local_ifacep;
141 };
142
143 /* All bridges, indexed by name. */
144 static struct hmap all_bridges = HMAP_INITIALIZER(&all_bridges);
145
146 /* OVSDB IDL used to obtain configuration. */
147 static struct ovsdb_idl *idl;
148
149 /* Most recently processed IDL sequence number. */
150 static unsigned int idl_seqno;
151
152 /* Each time this timer expires, the bridge fetches interface and mirror
153  * statistics and pushes them into the database. */
154 #define IFACE_STATS_INTERVAL (5 * 1000) /* In milliseconds. */
155 static long long int iface_stats_timer = LLONG_MIN;
156
157 /* In some datapaths, creating and destroying OpenFlow ports can be extremely
158  * expensive.  This can cause bridge_reconfigure() to take a long time during
159  * which no other work can be done.  To deal with this problem, we limit port
160  * adds and deletions to a window of OFP_PORT_ACTION_WINDOW milliseconds per
161  * call to bridge_reconfigure().  If there is more work to do after the limit
162  * is reached, 'need_reconfigure', is flagged and it's done on the next loop.
163  * This allows the rest of the code to catch up on important things like
164  * forwarding packets. */
165 #define OFP_PORT_ACTION_WINDOW 10
166 static bool reconfiguring = false;
167
168 static void add_del_bridges(const struct ovsrec_open_vswitch *);
169 static void bridge_update_ofprotos(void);
170 static void bridge_create(const struct ovsrec_bridge *);
171 static void bridge_destroy(struct bridge *);
172 static struct bridge *bridge_lookup(const char *name);
173 static unixctl_cb_func bridge_unixctl_dump_flows;
174 static unixctl_cb_func bridge_unixctl_reconnect;
175 static size_t bridge_get_controllers(const struct bridge *br,
176                                      struct ovsrec_controller ***controllersp);
177 static void bridge_add_del_ports(struct bridge *,
178                                  const unsigned long int *splinter_vlans);
179 static void bridge_refresh_ofp_port(struct bridge *);
180 static void bridge_configure_datapath_id(struct bridge *);
181 static void bridge_configure_flow_eviction_threshold(struct bridge *);
182 static void bridge_configure_netflow(struct bridge *);
183 static void bridge_configure_forward_bpdu(struct bridge *);
184 static void bridge_configure_mac_idle_time(struct bridge *);
185 static void bridge_configure_sflow(struct bridge *, int *sflow_bridge_number);
186 static void bridge_configure_stp(struct bridge *);
187 static void bridge_configure_tables(struct bridge *);
188 static void bridge_configure_remotes(struct bridge *,
189                                      const struct sockaddr_in *managers,
190                                      size_t n_managers);
191 static void bridge_pick_local_hw_addr(struct bridge *,
192                                       uint8_t ea[ETH_ADDR_LEN],
193                                       struct iface **hw_addr_iface);
194 static uint64_t bridge_pick_datapath_id(struct bridge *,
195                                         const uint8_t bridge_ea[ETH_ADDR_LEN],
196                                         struct iface *hw_addr_iface);
197 static void bridge_queue_if_cfg(struct bridge *,
198                                 const struct ovsrec_interface *,
199                                 const struct ovsrec_port *);
200 static uint64_t dpid_from_hash(const void *, size_t nbytes);
201 static bool bridge_has_bond_fake_iface(const struct bridge *,
202                                        const char *name);
203 static bool port_is_bond_fake_iface(const struct port *);
204
205 static unixctl_cb_func qos_unixctl_show;
206
207 static struct port *port_create(struct bridge *, const struct ovsrec_port *);
208 static void port_del_ifaces(struct port *);
209 static void port_destroy(struct port *);
210 static struct port *port_lookup(const struct bridge *, const char *name);
211 static void port_configure(struct port *);
212 static struct lacp_settings *port_configure_lacp(struct port *,
213                                                  struct lacp_settings *);
214 static void port_configure_bond(struct port *, struct bond_settings *,
215                                 uint32_t *bond_stable_ids);
216 static bool port_is_synthetic(const struct port *);
217
218 static void reconfigure_system_stats(const struct ovsrec_open_vswitch *);
219 static void run_system_stats(void);
220
221 static void bridge_configure_mirrors(struct bridge *);
222 static struct mirror *mirror_create(struct bridge *,
223                                     const struct ovsrec_mirror *);
224 static void mirror_destroy(struct mirror *);
225 static bool mirror_configure(struct mirror *);
226 static void mirror_refresh_stats(struct mirror *);
227
228 static void iface_configure_lacp(struct iface *, struct lacp_slave_settings *);
229 static bool iface_create(struct bridge *, struct if_cfg *, int ofp_port);
230 static const char *iface_get_type(const struct ovsrec_interface *,
231                                   const struct ovsrec_bridge *);
232 static void iface_destroy(struct iface *);
233 static struct iface *iface_lookup(const struct bridge *, const char *name);
234 static struct iface *iface_find(const char *name);
235 static struct if_cfg *if_cfg_lookup(const struct bridge *, const char *name);
236 static struct iface *iface_from_ofp_port(const struct bridge *,
237                                          uint16_t ofp_port);
238 static void iface_set_mac(struct iface *);
239 static void iface_set_ofport(const struct ovsrec_interface *, int64_t ofport);
240 static void iface_clear_db_record(const struct ovsrec_interface *if_cfg);
241 static void iface_configure_qos(struct iface *, const struct ovsrec_qos *);
242 static void iface_configure_cfm(struct iface *);
243 static void iface_refresh_cfm_stats(struct iface *);
244 static void iface_refresh_stats(struct iface *);
245 static void iface_refresh_status(struct iface *);
246 static bool iface_is_synthetic(const struct iface *);
247
248 /* Linux VLAN device support (e.g. "eth0.10" for VLAN 10.)
249  *
250  * This is deprecated.  It is only for compatibility with broken device drivers
251  * in old versions of Linux that do not properly support VLANs when VLAN
252  * devices are not used.  When broken device drivers are no longer in
253  * widespread use, we will delete these interfaces. */
254
255 /* True if VLAN splinters are enabled on any interface, false otherwise.*/
256 static bool vlan_splinters_enabled_anywhere;
257
258 static bool vlan_splinters_is_enabled(const struct ovsrec_interface *);
259 static unsigned long int *collect_splinter_vlans(
260     const struct ovsrec_open_vswitch *);
261 static void configure_splinter_port(struct port *);
262 static void add_vlan_splinter_ports(struct bridge *,
263                                     const unsigned long int *splinter_vlans,
264                                     struct shash *ports);
265
266 static void
267 bridge_init_ofproto(const struct ovsrec_open_vswitch *cfg)
268 {
269     struct shash iface_hints;
270     static bool initialized = false;
271     int i;
272
273     if (initialized) {
274         return;
275     }
276
277     shash_init(&iface_hints);
278
279     for (i = 0; i < cfg->n_bridges; i++) {
280         const struct ovsrec_bridge *br_cfg = cfg->bridges[i];
281         int j;
282
283         for (j = 0; j < br_cfg->n_ports; j++) {
284             struct ovsrec_port *port_cfg = br_cfg->ports[j];
285             int k;
286
287             for (k = 0; k < port_cfg->n_interfaces; k++) {
288                 struct ovsrec_interface *if_cfg = port_cfg->interfaces[k];
289                 struct iface_hint *iface_hint;
290
291                 iface_hint = xmalloc(sizeof *iface_hint);
292                 iface_hint->br_name = br_cfg->name;
293                 iface_hint->br_type = br_cfg->datapath_type;
294                 iface_hint->ofp_port = if_cfg->n_ofport_request ?
295                                        *if_cfg->ofport_request : OFPP_NONE;
296
297                 shash_add(&iface_hints, if_cfg->name, iface_hint);
298             }
299         }
300     }
301
302     ofproto_init(&iface_hints);
303
304     shash_destroy_free_data(&iface_hints);
305     initialized = true;
306 }
307 \f
308 /* Public functions. */
309
310 /* Initializes the bridge module, configuring it to obtain its configuration
311  * from an OVSDB server accessed over 'remote', which should be a string in a
312  * form acceptable to ovsdb_idl_create(). */
313 void
314 bridge_init(const char *remote)
315 {
316     /* Create connection to database. */
317     idl = ovsdb_idl_create(remote, &ovsrec_idl_class, true);
318     idl_seqno = ovsdb_idl_get_seqno(idl);
319     ovsdb_idl_set_lock(idl, "ovs_vswitchd");
320     ovsdb_idl_verify_write_only(idl);
321
322     ovsdb_idl_omit_alert(idl, &ovsrec_open_vswitch_col_cur_cfg);
323     ovsdb_idl_omit_alert(idl, &ovsrec_open_vswitch_col_statistics);
324     ovsdb_idl_omit(idl, &ovsrec_open_vswitch_col_external_ids);
325     ovsdb_idl_omit(idl, &ovsrec_open_vswitch_col_ovs_version);
326     ovsdb_idl_omit(idl, &ovsrec_open_vswitch_col_db_version);
327     ovsdb_idl_omit(idl, &ovsrec_open_vswitch_col_system_type);
328     ovsdb_idl_omit(idl, &ovsrec_open_vswitch_col_system_version);
329
330     ovsdb_idl_omit_alert(idl, &ovsrec_bridge_col_datapath_id);
331     ovsdb_idl_omit_alert(idl, &ovsrec_bridge_col_status);
332     ovsdb_idl_omit(idl, &ovsrec_bridge_col_external_ids);
333
334     ovsdb_idl_omit_alert(idl, &ovsrec_port_col_status);
335     ovsdb_idl_omit_alert(idl, &ovsrec_port_col_statistics);
336     ovsdb_idl_omit(idl, &ovsrec_port_col_external_ids);
337     ovsdb_idl_omit(idl, &ovsrec_port_col_fake_bridge);
338
339     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_admin_state);
340     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_duplex);
341     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_link_speed);
342     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_link_state);
343     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_link_resets);
344     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_mtu);
345     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_ofport);
346     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_statistics);
347     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_status);
348     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_cfm_fault);
349     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_cfm_fault_status);
350     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_cfm_remote_mpids);
351     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_cfm_health);
352     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_cfm_remote_opstate);
353     ovsdb_idl_omit_alert(idl, &ovsrec_interface_col_lacp_current);
354     ovsdb_idl_omit(idl, &ovsrec_interface_col_external_ids);
355
356     ovsdb_idl_omit_alert(idl, &ovsrec_controller_col_is_connected);
357     ovsdb_idl_omit_alert(idl, &ovsrec_controller_col_role);
358     ovsdb_idl_omit_alert(idl, &ovsrec_controller_col_status);
359     ovsdb_idl_omit(idl, &ovsrec_controller_col_external_ids);
360
361     ovsdb_idl_omit(idl, &ovsrec_qos_col_external_ids);
362
363     ovsdb_idl_omit(idl, &ovsrec_queue_col_external_ids);
364
365     ovsdb_idl_omit(idl, &ovsrec_mirror_col_external_ids);
366     ovsdb_idl_omit_alert(idl, &ovsrec_mirror_col_statistics);
367
368     ovsdb_idl_omit(idl, &ovsrec_netflow_col_external_ids);
369
370     ovsdb_idl_omit(idl, &ovsrec_sflow_col_external_ids);
371
372     ovsdb_idl_omit(idl, &ovsrec_manager_col_external_ids);
373     ovsdb_idl_omit(idl, &ovsrec_manager_col_inactivity_probe);
374     ovsdb_idl_omit(idl, &ovsrec_manager_col_is_connected);
375     ovsdb_idl_omit(idl, &ovsrec_manager_col_max_backoff);
376     ovsdb_idl_omit(idl, &ovsrec_manager_col_status);
377
378     ovsdb_idl_omit(idl, &ovsrec_ssl_col_external_ids);
379
380     /* Register unixctl commands. */
381     unixctl_command_register("qos/show", "interface", 1, 1,
382                              qos_unixctl_show, NULL);
383     unixctl_command_register("bridge/dump-flows", "bridge", 1, 1,
384                              bridge_unixctl_dump_flows, NULL);
385     unixctl_command_register("bridge/reconnect", "[bridge]", 0, 1,
386                              bridge_unixctl_reconnect, NULL);
387     lacp_init();
388     bond_init();
389     cfm_init();
390     stp_init();
391 }
392
393 void
394 bridge_exit(void)
395 {
396     struct bridge *br, *next_br;
397
398     HMAP_FOR_EACH_SAFE (br, next_br, node, &all_bridges) {
399         bridge_destroy(br);
400     }
401     ovsdb_idl_destroy(idl);
402 }
403
404 /* Looks at the list of managers in 'ovs_cfg' and extracts their remote IP
405  * addresses and ports into '*managersp' and '*n_managersp'.  The caller is
406  * responsible for freeing '*managersp' (with free()).
407  *
408  * You may be asking yourself "why does ovs-vswitchd care?", because
409  * ovsdb-server is responsible for connecting to the managers, and ovs-vswitchd
410  * should not be and in fact is not directly involved in that.  But
411  * ovs-vswitchd needs to make sure that ovsdb-server can reach the managers, so
412  * it has to tell in-band control where the managers are to enable that.
413  * (Thus, only managers connected in-band are collected.)
414  */
415 static void
416 collect_in_band_managers(const struct ovsrec_open_vswitch *ovs_cfg,
417                          struct sockaddr_in **managersp, size_t *n_managersp)
418 {
419     struct sockaddr_in *managers = NULL;
420     size_t n_managers = 0;
421     struct sset targets;
422     size_t i;
423
424     /* Collect all of the potential targets from the "targets" columns of the
425      * rows pointed to by "manager_options", excluding any that are
426      * out-of-band. */
427     sset_init(&targets);
428     for (i = 0; i < ovs_cfg->n_manager_options; i++) {
429         struct ovsrec_manager *m = ovs_cfg->manager_options[i];
430
431         if (m->connection_mode && !strcmp(m->connection_mode, "out-of-band")) {
432             sset_find_and_delete(&targets, m->target);
433         } else {
434             sset_add(&targets, m->target);
435         }
436     }
437
438     /* Now extract the targets' IP addresses. */
439     if (!sset_is_empty(&targets)) {
440         const char *target;
441
442         managers = xmalloc(sset_count(&targets) * sizeof *managers);
443         SSET_FOR_EACH (target, &targets) {
444             struct sockaddr_in *sin = &managers[n_managers];
445
446             if (stream_parse_target_with_default_ports(target,
447                                                        JSONRPC_TCP_PORT,
448                                                        JSONRPC_SSL_PORT,
449                                                        sin)) {
450                 n_managers++;
451             }
452         }
453     }
454     sset_destroy(&targets);
455
456     *managersp = managers;
457     *n_managersp = n_managers;
458 }
459
460 static void
461 bridge_reconfigure(const struct ovsrec_open_vswitch *ovs_cfg)
462 {
463     unsigned long int *splinter_vlans;
464     struct bridge *br;
465
466     COVERAGE_INC(bridge_reconfigure);
467
468     assert(!reconfiguring);
469     reconfiguring = true;
470
471     /* Destroy "struct bridge"s, "struct port"s, and "struct iface"s according
472      * to 'ovs_cfg' while update the "if_cfg_queue", with only very minimal
473      * configuration otherwise.
474      *
475      * This is mostly an update to bridge data structures. Nothing is pushed
476      * down to ofproto or lower layers. */
477     add_del_bridges(ovs_cfg);
478     splinter_vlans = collect_splinter_vlans(ovs_cfg);
479     HMAP_FOR_EACH (br, node, &all_bridges) {
480         bridge_add_del_ports(br, splinter_vlans);
481     }
482     free(splinter_vlans);
483
484     /* Delete datapaths that are no longer configured, and create ones which
485      * don't exist but should. */
486     bridge_update_ofprotos();
487
488     /* Make sure each "struct iface" has a correct ofp_port in its ofproto. */
489     HMAP_FOR_EACH (br, node, &all_bridges) {
490         bridge_refresh_ofp_port(br);
491     }
492
493     /* Clear database records for "if_cfg"s which haven't been instantiated. */
494     HMAP_FOR_EACH (br, node, &all_bridges) {
495         struct if_cfg *if_cfg;
496
497         HMAP_FOR_EACH (if_cfg, hmap_node, &br->if_cfg_todo) {
498             iface_clear_db_record(if_cfg->cfg);
499         }
500     }
501
502     reconfigure_system_stats(ovs_cfg);
503 }
504
505 static bool
506 bridge_reconfigure_ofp(void)
507 {
508     long long int deadline;
509     struct bridge *br;
510
511     time_refresh();
512     deadline = time_msec() + OFP_PORT_ACTION_WINDOW;
513
514     /* The kernel will reject any attempt to add a given port to a datapath if
515      * that port already belongs to a different datapath, so we must do all
516      * port deletions before any port additions. */
517     HMAP_FOR_EACH (br, node, &all_bridges) {
518         struct ofpp_garbage *garbage, *next;
519
520         LIST_FOR_EACH_SAFE (garbage, next, list_node, &br->ofpp_garbage) {
521             /* It's a bit dangerous to call bridge_run_fast() here as ofproto's
522              * internal datastructures may not be consistent.  Eventually, when
523              * port additions and deletions are cheaper, these calls should be
524              * removed. */
525             bridge_run_fast();
526             ofproto_port_del(br->ofproto, garbage->ofp_port);
527             list_remove(&garbage->list_node);
528             free(garbage);
529
530             time_refresh();
531             if (time_msec() >= deadline) {
532                 return false;
533             }
534             bridge_run_fast();
535         }
536     }
537
538     HMAP_FOR_EACH (br, node, &all_bridges) {
539         struct if_cfg *if_cfg, *next;
540
541         HMAP_FOR_EACH_SAFE (if_cfg, next, hmap_node, &br->if_cfg_todo) {
542             iface_create(br, if_cfg, -1);
543             time_refresh();
544             if (time_msec() >= deadline) {
545                 return false;
546             }
547         }
548     }
549
550     return true;
551 }
552
553 static bool
554 bridge_reconfigure_continue(const struct ovsrec_open_vswitch *ovs_cfg)
555 {
556     struct sockaddr_in *managers;
557     int sflow_bridge_number;
558     size_t n_managers;
559     struct bridge *br;
560     bool done;
561
562     assert(reconfiguring);
563     done = bridge_reconfigure_ofp();
564
565     /* Complete the configuration. */
566     sflow_bridge_number = 0;
567     collect_in_band_managers(ovs_cfg, &managers, &n_managers);
568     HMAP_FOR_EACH (br, node, &all_bridges) {
569         struct port *port;
570
571         /* We need the datapath ID early to allow LACP ports to use it as the
572          * default system ID. */
573         bridge_configure_datapath_id(br);
574
575         HMAP_FOR_EACH (port, hmap_node, &br->ports) {
576             struct iface *iface;
577
578             port_configure(port);
579
580             LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
581                 iface_configure_cfm(iface);
582                 iface_configure_qos(iface, port->cfg->qos);
583                 iface_set_mac(iface);
584             }
585         }
586         bridge_configure_mirrors(br);
587         bridge_configure_flow_eviction_threshold(br);
588         bridge_configure_forward_bpdu(br);
589         bridge_configure_mac_idle_time(br);
590         bridge_configure_remotes(br, managers, n_managers);
591         bridge_configure_netflow(br);
592         bridge_configure_sflow(br, &sflow_bridge_number);
593         bridge_configure_stp(br);
594         bridge_configure_tables(br);
595     }
596     free(managers);
597
598     if (done) {
599         /* ovs-vswitchd has completed initialization, so allow the process that
600          * forked us to exit successfully. */
601         daemonize_complete();
602         reconfiguring = false;
603
604         VLOG_INFO("%s (Open vSwitch) %s", program_name, VERSION);
605     }
606
607     return done;
608 }
609
610 /* Delete ofprotos which aren't configured or have the wrong type.  Create
611  * ofprotos which don't exist but need to. */
612 static void
613 bridge_update_ofprotos(void)
614 {
615     struct bridge *br, *next;
616     struct sset names;
617     struct sset types;
618     const char *type;
619
620     /* Delete ofprotos with no bridge or with the wrong type. */
621     sset_init(&names);
622     sset_init(&types);
623     ofproto_enumerate_types(&types);
624     SSET_FOR_EACH (type, &types) {
625         const char *name;
626
627         ofproto_enumerate_names(type, &names);
628         SSET_FOR_EACH (name, &names) {
629             br = bridge_lookup(name);
630             if (!br || strcmp(type, br->type)) {
631                 ofproto_delete(name, type);
632             }
633         }
634     }
635     sset_destroy(&names);
636     sset_destroy(&types);
637
638     /* Add ofprotos for bridges which don't have one yet. */
639     HMAP_FOR_EACH_SAFE (br, next, node, &all_bridges) {
640         struct bridge *br2;
641         int error;
642
643         if (br->ofproto) {
644             continue;
645         }
646
647         /* Remove ports from any datapath with the same name as 'br'.  If we
648          * don't do this, creating 'br''s ofproto will fail because a port with
649          * the same name as its local port already exists. */
650         HMAP_FOR_EACH (br2, node, &all_bridges) {
651             struct ofproto_port ofproto_port;
652
653             if (!br2->ofproto) {
654                 continue;
655             }
656
657             if (!ofproto_port_query_by_name(br2->ofproto, br->name,
658                                             &ofproto_port)) {
659                 error = ofproto_port_del(br2->ofproto, ofproto_port.ofp_port);
660                 if (error) {
661                     VLOG_ERR("failed to delete port %s: %s", ofproto_port.name,
662                              strerror(error));
663                 }
664                 ofproto_port_destroy(&ofproto_port);
665             }
666         }
667
668         error = ofproto_create(br->name, br->type, &br->ofproto);
669         if (error) {
670             VLOG_ERR("failed to create bridge %s: %s", br->name,
671                      strerror(error));
672             bridge_destroy(br);
673         }
674     }
675 }
676
677 static void
678 port_configure(struct port *port)
679 {
680     const struct ovsrec_port *cfg = port->cfg;
681     struct bond_settings bond_settings;
682     struct lacp_settings lacp_settings;
683     struct ofproto_bundle_settings s;
684     struct iface *iface;
685
686     if (cfg->vlan_mode && !strcmp(cfg->vlan_mode, "splinter")) {
687         configure_splinter_port(port);
688         return;
689     }
690
691     /* Get name. */
692     s.name = port->name;
693
694     /* Get slaves. */
695     s.n_slaves = 0;
696     s.slaves = xmalloc(list_size(&port->ifaces) * sizeof *s.slaves);
697     LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
698         s.slaves[s.n_slaves++] = iface->ofp_port;
699     }
700
701     /* Get VLAN tag. */
702     s.vlan = -1;
703     if (cfg->tag && *cfg->tag >= 0 && *cfg->tag <= 4095) {
704         s.vlan = *cfg->tag;
705     }
706
707     /* Get VLAN trunks. */
708     s.trunks = NULL;
709     if (cfg->n_trunks) {
710         s.trunks = vlan_bitmap_from_array(cfg->trunks, cfg->n_trunks);
711     }
712
713     /* Get VLAN mode. */
714     if (cfg->vlan_mode) {
715         if (!strcmp(cfg->vlan_mode, "access")) {
716             s.vlan_mode = PORT_VLAN_ACCESS;
717         } else if (!strcmp(cfg->vlan_mode, "trunk")) {
718             s.vlan_mode = PORT_VLAN_TRUNK;
719         } else if (!strcmp(cfg->vlan_mode, "native-tagged")) {
720             s.vlan_mode = PORT_VLAN_NATIVE_TAGGED;
721         } else if (!strcmp(cfg->vlan_mode, "native-untagged")) {
722             s.vlan_mode = PORT_VLAN_NATIVE_UNTAGGED;
723         } else {
724             /* This "can't happen" because ovsdb-server should prevent it. */
725             VLOG_ERR("unknown VLAN mode %s", cfg->vlan_mode);
726             s.vlan_mode = PORT_VLAN_TRUNK;
727         }
728     } else {
729         if (s.vlan >= 0) {
730             s.vlan_mode = PORT_VLAN_ACCESS;
731             if (cfg->n_trunks) {
732                 VLOG_ERR("port %s: ignoring trunks in favor of implicit vlan",
733                          port->name);
734             }
735         } else {
736             s.vlan_mode = PORT_VLAN_TRUNK;
737         }
738     }
739     s.use_priority_tags = smap_get_bool(&cfg->other_config, "priority-tags",
740                                         false);
741
742     /* Get LACP settings. */
743     s.lacp = port_configure_lacp(port, &lacp_settings);
744     if (s.lacp) {
745         size_t i = 0;
746
747         s.lacp_slaves = xmalloc(s.n_slaves * sizeof *s.lacp_slaves);
748         LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
749             iface_configure_lacp(iface, &s.lacp_slaves[i++]);
750         }
751     } else {
752         s.lacp_slaves = NULL;
753     }
754
755     /* Get bond settings. */
756     if (s.n_slaves > 1) {
757         s.bond = &bond_settings;
758         s.bond_stable_ids = xmalloc(s.n_slaves * sizeof *s.bond_stable_ids);
759         port_configure_bond(port, &bond_settings, s.bond_stable_ids);
760     } else {
761         s.bond = NULL;
762         s.bond_stable_ids = NULL;
763
764         LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
765             netdev_set_miimon_interval(iface->netdev, 0);
766         }
767     }
768
769     /* Register. */
770     ofproto_bundle_register(port->bridge->ofproto, port, &s);
771
772     /* Clean up. */
773     free(s.slaves);
774     free(s.trunks);
775     free(s.lacp_slaves);
776     free(s.bond_stable_ids);
777 }
778
779 /* Pick local port hardware address and datapath ID for 'br'. */
780 static void
781 bridge_configure_datapath_id(struct bridge *br)
782 {
783     uint8_t ea[ETH_ADDR_LEN];
784     uint64_t dpid;
785     struct iface *local_iface;
786     struct iface *hw_addr_iface;
787     char *dpid_string;
788
789     bridge_pick_local_hw_addr(br, ea, &hw_addr_iface);
790     local_iface = iface_from_ofp_port(br, OFPP_LOCAL);
791     if (local_iface) {
792         int error = netdev_set_etheraddr(local_iface->netdev, ea);
793         if (error) {
794             static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 5);
795             VLOG_ERR_RL(&rl, "bridge %s: failed to set bridge "
796                         "Ethernet address: %s",
797                         br->name, strerror(error));
798         }
799     }
800     memcpy(br->ea, ea, ETH_ADDR_LEN);
801
802     dpid = bridge_pick_datapath_id(br, ea, hw_addr_iface);
803     if (dpid != ofproto_get_datapath_id(br->ofproto)) {
804         VLOG_INFO("bridge %s: using datapath ID %016"PRIx64, br->name, dpid);
805         ofproto_set_datapath_id(br->ofproto, dpid);
806     }
807
808     dpid_string = xasprintf("%016"PRIx64, dpid);
809     ovsrec_bridge_set_datapath_id(br->cfg, dpid_string);
810     free(dpid_string);
811 }
812
813 /* Set NetFlow configuration on 'br'. */
814 static void
815 bridge_configure_netflow(struct bridge *br)
816 {
817     struct ovsrec_netflow *cfg = br->cfg->netflow;
818     struct netflow_options opts;
819
820     if (!cfg) {
821         ofproto_set_netflow(br->ofproto, NULL);
822         return;
823     }
824
825     memset(&opts, 0, sizeof opts);
826
827     /* Get default NetFlow configuration from datapath.
828      * Apply overrides from 'cfg'. */
829     ofproto_get_netflow_ids(br->ofproto, &opts.engine_type, &opts.engine_id);
830     if (cfg->engine_type) {
831         opts.engine_type = *cfg->engine_type;
832     }
833     if (cfg->engine_id) {
834         opts.engine_id = *cfg->engine_id;
835     }
836
837     /* Configure active timeout interval. */
838     opts.active_timeout = cfg->active_timeout;
839     if (!opts.active_timeout) {
840         opts.active_timeout = -1;
841     } else if (opts.active_timeout < 0) {
842         VLOG_WARN("bridge %s: active timeout interval set to negative "
843                   "value, using default instead (%d seconds)", br->name,
844                   NF_ACTIVE_TIMEOUT_DEFAULT);
845         opts.active_timeout = -1;
846     }
847
848     /* Add engine ID to interface number to disambiguate bridgs? */
849     opts.add_id_to_iface = cfg->add_id_to_interface;
850     if (opts.add_id_to_iface) {
851         if (opts.engine_id > 0x7f) {
852             VLOG_WARN("bridge %s: NetFlow port mangling may conflict with "
853                       "another vswitch, choose an engine id less than 128",
854                       br->name);
855         }
856         if (hmap_count(&br->ports) > 508) {
857             VLOG_WARN("bridge %s: NetFlow port mangling will conflict with "
858                       "another port when more than 508 ports are used",
859                       br->name);
860         }
861     }
862
863     /* Collectors. */
864     sset_init(&opts.collectors);
865     sset_add_array(&opts.collectors, cfg->targets, cfg->n_targets);
866
867     /* Configure. */
868     if (ofproto_set_netflow(br->ofproto, &opts)) {
869         VLOG_ERR("bridge %s: problem setting netflow collectors", br->name);
870     }
871     sset_destroy(&opts.collectors);
872 }
873
874 /* Set sFlow configuration on 'br'. */
875 static void
876 bridge_configure_sflow(struct bridge *br, int *sflow_bridge_number)
877 {
878     const struct ovsrec_sflow *cfg = br->cfg->sflow;
879     struct ovsrec_controller **controllers;
880     struct ofproto_sflow_options oso;
881     size_t n_controllers;
882     size_t i;
883
884     if (!cfg) {
885         ofproto_set_sflow(br->ofproto, NULL);
886         return;
887     }
888
889     memset(&oso, 0, sizeof oso);
890
891     sset_init(&oso.targets);
892     sset_add_array(&oso.targets, cfg->targets, cfg->n_targets);
893
894     oso.sampling_rate = SFL_DEFAULT_SAMPLING_RATE;
895     if (cfg->sampling) {
896         oso.sampling_rate = *cfg->sampling;
897     }
898
899     oso.polling_interval = SFL_DEFAULT_POLLING_INTERVAL;
900     if (cfg->polling) {
901         oso.polling_interval = *cfg->polling;
902     }
903
904     oso.header_len = SFL_DEFAULT_HEADER_SIZE;
905     if (cfg->header) {
906         oso.header_len = *cfg->header;
907     }
908
909     oso.sub_id = (*sflow_bridge_number)++;
910     oso.agent_device = cfg->agent;
911
912     oso.control_ip = NULL;
913     n_controllers = bridge_get_controllers(br, &controllers);
914     for (i = 0; i < n_controllers; i++) {
915         if (controllers[i]->local_ip) {
916             oso.control_ip = controllers[i]->local_ip;
917             break;
918         }
919     }
920     ofproto_set_sflow(br->ofproto, &oso);
921
922     sset_destroy(&oso.targets);
923 }
924
925 static void
926 port_configure_stp(const struct ofproto *ofproto, struct port *port,
927                    struct ofproto_port_stp_settings *port_s,
928                    int *port_num_counter, unsigned long *port_num_bitmap)
929 {
930     const char *config_str;
931     struct iface *iface;
932
933     if (!smap_get_bool(&port->cfg->other_config, "stp-enable", true)) {
934         port_s->enable = false;
935         return;
936     } else {
937         port_s->enable = true;
938     }
939
940     /* STP over bonds is not supported. */
941     if (!list_is_singleton(&port->ifaces)) {
942         VLOG_ERR("port %s: cannot enable STP on bonds, disabling",
943                  port->name);
944         port_s->enable = false;
945         return;
946     }
947
948     iface = CONTAINER_OF(list_front(&port->ifaces), struct iface, port_elem);
949
950     /* Internal ports shouldn't participate in spanning tree, so
951      * skip them. */
952     if (!strcmp(iface->type, "internal")) {
953         VLOG_DBG("port %s: disable STP on internal ports", port->name);
954         port_s->enable = false;
955         return;
956     }
957
958     /* STP on mirror output ports is not supported. */
959     if (ofproto_is_mirror_output_bundle(ofproto, port)) {
960         VLOG_DBG("port %s: disable STP on mirror ports", port->name);
961         port_s->enable = false;
962         return;
963     }
964
965     config_str = smap_get(&port->cfg->other_config, "stp-port-num");
966     if (config_str) {
967         unsigned long int port_num = strtoul(config_str, NULL, 0);
968         int port_idx = port_num - 1;
969
970         if (port_num < 1 || port_num > STP_MAX_PORTS) {
971             VLOG_ERR("port %s: invalid stp-port-num", port->name);
972             port_s->enable = false;
973             return;
974         }
975
976         if (bitmap_is_set(port_num_bitmap, port_idx)) {
977             VLOG_ERR("port %s: duplicate stp-port-num %lu, disabling",
978                     port->name, port_num);
979             port_s->enable = false;
980             return;
981         }
982         bitmap_set1(port_num_bitmap, port_idx);
983         port_s->port_num = port_idx;
984     } else {
985         if (*port_num_counter >= STP_MAX_PORTS) {
986             VLOG_ERR("port %s: too many STP ports, disabling", port->name);
987             port_s->enable = false;
988             return;
989         }
990
991         port_s->port_num = (*port_num_counter)++;
992     }
993
994     config_str = smap_get(&port->cfg->other_config, "stp-path-cost");
995     if (config_str) {
996         port_s->path_cost = strtoul(config_str, NULL, 10);
997     } else {
998         enum netdev_features current;
999
1000         if (netdev_get_features(iface->netdev, &current, NULL, NULL, NULL)) {
1001             /* Couldn't get speed, so assume 100Mb/s. */
1002             port_s->path_cost = 19;
1003         } else {
1004             unsigned int mbps;
1005
1006             mbps = netdev_features_to_bps(current) / 1000000;
1007             port_s->path_cost = stp_convert_speed_to_cost(mbps);
1008         }
1009     }
1010
1011     config_str = smap_get(&port->cfg->other_config, "stp-port-priority");
1012     if (config_str) {
1013         port_s->priority = strtoul(config_str, NULL, 0);
1014     } else {
1015         port_s->priority = STP_DEFAULT_PORT_PRIORITY;
1016     }
1017 }
1018
1019 /* Set spanning tree configuration on 'br'. */
1020 static void
1021 bridge_configure_stp(struct bridge *br)
1022 {
1023     if (!br->cfg->stp_enable) {
1024         ofproto_set_stp(br->ofproto, NULL);
1025     } else {
1026         struct ofproto_stp_settings br_s;
1027         const char *config_str;
1028         struct port *port;
1029         int port_num_counter;
1030         unsigned long *port_num_bitmap;
1031
1032         config_str = smap_get(&br->cfg->other_config, "stp-system-id");
1033         if (config_str) {
1034             uint8_t ea[ETH_ADDR_LEN];
1035
1036             if (eth_addr_from_string(config_str, ea)) {
1037                 br_s.system_id = eth_addr_to_uint64(ea);
1038             } else {
1039                 br_s.system_id = eth_addr_to_uint64(br->ea);
1040                 VLOG_ERR("bridge %s: invalid stp-system-id, defaulting "
1041                          "to "ETH_ADDR_FMT, br->name, ETH_ADDR_ARGS(br->ea));
1042             }
1043         } else {
1044             br_s.system_id = eth_addr_to_uint64(br->ea);
1045         }
1046
1047         config_str = smap_get(&br->cfg->other_config, "stp-priority");
1048         if (config_str) {
1049             br_s.priority = strtoul(config_str, NULL, 0);
1050         } else {
1051             br_s.priority = STP_DEFAULT_BRIDGE_PRIORITY;
1052         }
1053
1054         config_str = smap_get(&br->cfg->other_config, "stp-hello-time");
1055         if (config_str) {
1056             br_s.hello_time = strtoul(config_str, NULL, 10) * 1000;
1057         } else {
1058             br_s.hello_time = STP_DEFAULT_HELLO_TIME;
1059         }
1060
1061         config_str = smap_get(&br->cfg->other_config, "stp-max-age");
1062         if (config_str) {
1063             br_s.max_age = strtoul(config_str, NULL, 10) * 1000;
1064         } else {
1065             br_s.max_age = STP_DEFAULT_MAX_AGE;
1066         }
1067
1068         config_str = smap_get(&br->cfg->other_config, "stp-forward-delay");
1069         if (config_str) {
1070             br_s.fwd_delay = strtoul(config_str, NULL, 10) * 1000;
1071         } else {
1072             br_s.fwd_delay = STP_DEFAULT_FWD_DELAY;
1073         }
1074
1075         /* Configure STP on the bridge. */
1076         if (ofproto_set_stp(br->ofproto, &br_s)) {
1077             VLOG_ERR("bridge %s: could not enable STP", br->name);
1078             return;
1079         }
1080
1081         /* Users must either set the port number with the "stp-port-num"
1082          * configuration on all ports or none.  If manual configuration
1083          * is not done, then we allocate them sequentially. */
1084         port_num_counter = 0;
1085         port_num_bitmap = bitmap_allocate(STP_MAX_PORTS);
1086         HMAP_FOR_EACH (port, hmap_node, &br->ports) {
1087             struct ofproto_port_stp_settings port_s;
1088             struct iface *iface;
1089
1090             port_configure_stp(br->ofproto, port, &port_s,
1091                                &port_num_counter, port_num_bitmap);
1092
1093             /* As bonds are not supported, just apply configuration to
1094              * all interfaces. */
1095             LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
1096                 if (ofproto_port_set_stp(br->ofproto, iface->ofp_port,
1097                                          &port_s)) {
1098                     VLOG_ERR("port %s: could not enable STP", port->name);
1099                     continue;
1100                 }
1101             }
1102         }
1103
1104         if (bitmap_scan(port_num_bitmap, 0, STP_MAX_PORTS) != STP_MAX_PORTS
1105                     && port_num_counter) {
1106             VLOG_ERR("bridge %s: must manually configure all STP port "
1107                      "IDs or none, disabling", br->name);
1108             ofproto_set_stp(br->ofproto, NULL);
1109         }
1110         bitmap_free(port_num_bitmap);
1111     }
1112 }
1113
1114 static bool
1115 bridge_has_bond_fake_iface(const struct bridge *br, const char *name)
1116 {
1117     const struct port *port = port_lookup(br, name);
1118     return port && port_is_bond_fake_iface(port);
1119 }
1120
1121 static bool
1122 port_is_bond_fake_iface(const struct port *port)
1123 {
1124     return port->cfg->bond_fake_iface && !list_is_short(&port->ifaces);
1125 }
1126
1127 static void
1128 add_del_bridges(const struct ovsrec_open_vswitch *cfg)
1129 {
1130     struct bridge *br, *next;
1131     struct shash new_br;
1132     size_t i;
1133
1134     /* Collect new bridges' names and types. */
1135     shash_init(&new_br);
1136     for (i = 0; i < cfg->n_bridges; i++) {
1137         static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 5);
1138         const struct ovsrec_bridge *br_cfg = cfg->bridges[i];
1139
1140         if (strchr(br_cfg->name, '/')) {
1141             /* Prevent remote ovsdb-server users from accessing arbitrary
1142              * directories, e.g. consider a bridge named "../../../etc/". */
1143             VLOG_WARN_RL(&rl, "ignoring bridge with invalid name \"%s\"",
1144                          br_cfg->name);
1145         } else if (!shash_add_once(&new_br, br_cfg->name, br_cfg)) {
1146             VLOG_WARN_RL(&rl, "bridge %s specified twice", br_cfg->name);
1147         }
1148     }
1149
1150     /* Get rid of deleted bridges or those whose types have changed.
1151      * Update 'cfg' of bridges that still exist. */
1152     HMAP_FOR_EACH_SAFE (br, next, node, &all_bridges) {
1153         br->cfg = shash_find_data(&new_br, br->name);
1154         if (!br->cfg || strcmp(br->type, ofproto_normalize_type(
1155                                    br->cfg->datapath_type))) {
1156             bridge_destroy(br);
1157         }
1158     }
1159
1160     /* Add new bridges. */
1161     for (i = 0; i < cfg->n_bridges; i++) {
1162         const struct ovsrec_bridge *br_cfg = cfg->bridges[i];
1163         struct bridge *br = bridge_lookup(br_cfg->name);
1164         if (!br) {
1165             bridge_create(br_cfg);
1166         }
1167     }
1168
1169     shash_destroy(&new_br);
1170 }
1171
1172 static void
1173 iface_set_ofp_port(struct iface *iface, int ofp_port)
1174 {
1175     struct bridge *br = iface->port->bridge;
1176
1177     assert(iface->ofp_port < 0 && ofp_port >= 0);
1178     iface->ofp_port = ofp_port;
1179     hmap_insert(&br->ifaces, &iface->ofp_port_node, hash_int(ofp_port, 0));
1180     iface_set_ofport(iface->cfg, ofp_port);
1181 }
1182
1183 /* Configures 'netdev' based on the "options" column in 'iface_cfg'.
1184  * Returns 0 if successful, otherwise a positive errno value. */
1185 static int
1186 iface_set_netdev_config(const struct ovsrec_interface *iface_cfg,
1187                         struct netdev *netdev)
1188 {
1189     int error;
1190
1191     error = netdev_set_config(netdev, &iface_cfg->options);
1192     if (error) {
1193         VLOG_WARN("could not configure network device %s (%s)",
1194                   iface_cfg->name, strerror(error));
1195     }
1196     return error;
1197 }
1198
1199 /* This function determines whether 'ofproto_port', which is attached to
1200  * br->ofproto's datapath, is one that we want in 'br'.
1201  *
1202  * If it is, it returns true, after creating an iface (if necessary),
1203  * configuring the iface's netdev according to the iface's options, and setting
1204  * iface's ofp_port member to 'ofproto_port->ofp_port'.
1205  *
1206  * If, on the other hand, 'port' should be removed, it returns false.  The
1207  * caller should later detach the port from br->ofproto. */
1208 static bool
1209 bridge_refresh_one_ofp_port(struct bridge *br,
1210                             const struct ofproto_port *ofproto_port)
1211 {
1212     const char *name = ofproto_port->name;
1213     const char *type = ofproto_port->type;
1214     uint16_t ofp_port = ofproto_port->ofp_port;
1215
1216     struct iface *iface = iface_lookup(br, name);
1217     if (iface) {
1218         /* Check that the name-to-number mapping is one-to-one. */
1219         if (iface->ofp_port >= 0) {
1220             VLOG_WARN("bridge %s: interface %s reported twice",
1221                       br->name, name);
1222             return false;
1223         } else if (iface_from_ofp_port(br, ofp_port)) {
1224             VLOG_WARN("bridge %s: interface %"PRIu16" reported twice",
1225                       br->name, ofp_port);
1226             return false;
1227         }
1228
1229         /* There's a configured interface named 'name'. */
1230         if (strcmp(type, iface->type)
1231             || iface_set_netdev_config(iface->cfg, iface->netdev)) {
1232             /* It's the wrong type, or it's the right type but can't be
1233              * configured as the user requested, so we must destroy it. */
1234             return false;
1235         } else {
1236             /* It's the right type and configured correctly.  keep it. */
1237             iface_set_ofp_port(iface, ofp_port);
1238             return true;
1239         }
1240     } else if (bridge_has_bond_fake_iface(br, name)
1241                && !strcmp(type, "internal")) {
1242         /* It's a bond fake iface.  Keep it. */
1243         return true;
1244     } else {
1245         /* There's no configured interface named 'name', but there might be an
1246          * interface of that name queued to be created.
1247          *
1248          * If there is, and it has the correct type, then try to configure it
1249          * and add it.  If that's successful, we'll keep it.  Otherwise, we'll
1250          * delete it and later try to re-add it. */
1251         struct if_cfg *if_cfg = if_cfg_lookup(br, name);
1252         return (if_cfg
1253                 && !strcmp(type, iface_get_type(if_cfg->cfg, br->cfg))
1254                 && iface_create(br, if_cfg, ofp_port));
1255     }
1256 }
1257
1258 /* Update bridges "if_cfg"s, "struct port"s, and "struct iface"s to be
1259  * consistent with the ofp_ports in "br->ofproto". */
1260 static void
1261 bridge_refresh_ofp_port(struct bridge *br)
1262 {
1263     struct ofproto_port_dump dump;
1264     struct ofproto_port ofproto_port;
1265     struct port *port, *port_next;
1266
1267     /* Clear each "struct iface"s ofp_port so we can get its correct value. */
1268     hmap_clear(&br->ifaces);
1269     HMAP_FOR_EACH (port, hmap_node, &br->ports) {
1270         struct iface *iface;
1271
1272         LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
1273             iface->ofp_port = -1;
1274         }
1275     }
1276
1277     /* Obtain the correct "ofp_port"s from ofproto. Find any if_cfg's which
1278      * already exist in the datapath and promote them to full fledged "struct
1279      * iface"s.  Mark ports in the datapath which don't belong as garbage. */
1280     OFPROTO_PORT_FOR_EACH (&ofproto_port, &dump, br->ofproto) {
1281         if (!bridge_refresh_one_ofp_port(br, &ofproto_port)) {
1282             struct ofpp_garbage *garbage = xmalloc(sizeof *garbage);
1283             garbage->ofp_port = ofproto_port.ofp_port;
1284             list_push_front(&br->ofpp_garbage, &garbage->list_node);
1285         }
1286     }
1287
1288     /* Some ifaces may not have "ofp_port"s in ofproto and therefore don't
1289      * deserve to have "struct iface"s.  Demote these to "if_cfg"s so that
1290      * later they can be added to ofproto. */
1291     HMAP_FOR_EACH_SAFE (port, port_next, hmap_node, &br->ports) {
1292         struct iface *iface, *iface_next;
1293
1294         LIST_FOR_EACH_SAFE (iface, iface_next, port_elem, &port->ifaces) {
1295             if (iface->ofp_port < 0) {
1296                 bridge_queue_if_cfg(br, iface->cfg, port->cfg);
1297                 iface_destroy(iface);
1298             }
1299         }
1300
1301         if (list_is_empty(&port->ifaces)) {
1302             port_destroy(port);
1303         }
1304     }
1305 }
1306
1307 /* Opens a network device for 'if_cfg' and configures it.  If '*ofp_portp'
1308  * is negative, adds the network device to br->ofproto and stores the OpenFlow
1309  * port number in '*ofp_portp'; otherwise leaves br->ofproto and '*ofp_portp'
1310  * untouched.
1311  *
1312  * If successful, returns 0 and stores the network device in '*netdevp'.  On
1313  * failure, returns a positive errno value and stores NULL in '*netdevp'. */
1314 static int
1315 iface_do_create(const struct bridge *br,
1316                 const struct if_cfg *if_cfg,
1317                 int *ofp_portp, struct netdev **netdevp)
1318 {
1319     const struct ovsrec_interface *iface_cfg = if_cfg->cfg;
1320     const struct ovsrec_port *port_cfg = if_cfg->parent;
1321     struct netdev *netdev;
1322     int error;
1323
1324     error = netdev_open(iface_cfg->name,
1325                         iface_get_type(iface_cfg, br->cfg), &netdev);
1326     if (error) {
1327         VLOG_WARN("could not open network device %s (%s)",
1328                   iface_cfg->name, strerror(error));
1329         goto error;
1330     }
1331
1332     error = iface_set_netdev_config(iface_cfg, netdev);
1333     if (error) {
1334         goto error;
1335     }
1336
1337     if (*ofp_portp < 0) {
1338         uint16_t ofp_port = if_cfg->ofport;
1339
1340         error = ofproto_port_add(br->ofproto, netdev, &ofp_port);
1341         if (error) {
1342             goto error;
1343         }
1344         *ofp_portp = ofp_port;
1345
1346         VLOG_INFO("bridge %s: added interface %s on port %d",
1347                   br->name, iface_cfg->name, *ofp_portp);
1348     } else {
1349         VLOG_DBG("bridge %s: interface %s is on port %d",
1350                  br->name, iface_cfg->name, *ofp_portp);
1351     }
1352
1353     if (port_cfg->vlan_mode && !strcmp(port_cfg->vlan_mode, "splinter")) {
1354         netdev_turn_flags_on(netdev, NETDEV_UP, true);
1355     }
1356
1357     *netdevp = netdev;
1358     return 0;
1359
1360 error:
1361     *netdevp = NULL;
1362     netdev_close(netdev);
1363     return error;
1364 }
1365
1366 /* Creates a new iface on 'br' based on 'if_cfg'.  The new iface has OpenFlow
1367  * port number 'ofp_port'.  If ofp_port is negative, an OpenFlow port is
1368  * automatically allocated for the iface.  Takes ownership of and
1369  * deallocates 'if_cfg'.
1370  *
1371  * Return true if an iface is successfully created, false otherwise. */
1372 static bool
1373 iface_create(struct bridge *br, struct if_cfg *if_cfg, int ofp_port)
1374 {
1375     const struct ovsrec_interface *iface_cfg = if_cfg->cfg;
1376     const struct ovsrec_port *port_cfg = if_cfg->parent;
1377
1378     struct netdev *netdev;
1379     struct iface *iface;
1380     struct port *port;
1381     int error;
1382     bool ok = true;
1383
1384     /* Do the bits that can fail up front.
1385      *
1386      * It's a bit dangerous to call bridge_run_fast() here as ofproto's
1387      * internal datastructures may not be consistent.  Eventually, when port
1388      * additions and deletions are cheaper, these calls should be removed. */
1389     bridge_run_fast();
1390     assert(!iface_lookup(br, iface_cfg->name));
1391     error = iface_do_create(br, if_cfg, &ofp_port, &netdev);
1392     bridge_run_fast();
1393     if (error) {
1394         iface_clear_db_record(iface_cfg);
1395         ok = false;
1396         goto done;
1397     }
1398
1399     /* Get or create the port structure. */
1400     port = port_lookup(br, port_cfg->name);
1401     if (!port) {
1402         port = port_create(br, port_cfg);
1403     }
1404
1405     /* Create the iface structure. */
1406     iface = xzalloc(sizeof *iface);
1407     list_push_back(&port->ifaces, &iface->port_elem);
1408     hmap_insert(&br->iface_by_name, &iface->name_node,
1409                 hash_string(iface_cfg->name, 0));
1410     iface->port = port;
1411     iface->name = xstrdup(iface_cfg->name);
1412     iface->ofp_port = -1;
1413     iface->netdev = netdev;
1414     iface->type = iface_get_type(iface_cfg, br->cfg);
1415     iface->cfg = iface_cfg;
1416
1417     iface_set_ofp_port(iface, ofp_port);
1418
1419     /* Populate initial status in database. */
1420     iface_refresh_stats(iface);
1421     iface_refresh_status(iface);
1422
1423     /* Add bond fake iface if necessary. */
1424     if (port_is_bond_fake_iface(port)) {
1425         struct ofproto_port ofproto_port;
1426
1427         if (ofproto_port_query_by_name(br->ofproto, port->name,
1428                                        &ofproto_port)) {
1429             struct netdev *netdev;
1430             int error;
1431
1432             error = netdev_open(port->name, "internal", &netdev);
1433             if (!error) {
1434                 uint16_t ofp_port = if_cfg->ofport;
1435
1436                 ofproto_port_add(br->ofproto, netdev, &ofp_port);
1437                 netdev_close(netdev);
1438             } else {
1439                 VLOG_WARN("could not open network device %s (%s)",
1440                           port->name, strerror(error));
1441             }
1442         } else {
1443             /* Already exists, nothing to do. */
1444             ofproto_port_destroy(&ofproto_port);
1445         }
1446     }
1447
1448 done:
1449     hmap_remove(&br->if_cfg_todo, &if_cfg->hmap_node);
1450     free(if_cfg);
1451
1452     return ok;
1453 }
1454
1455 /* Set Flow eviction threshold */
1456 static void
1457 bridge_configure_flow_eviction_threshold(struct bridge *br)
1458 {
1459     const char *threshold_str;
1460     unsigned threshold;
1461
1462     threshold_str = smap_get(&br->cfg->other_config,
1463                              "flow-eviction-threshold");
1464     if (threshold_str) {
1465         threshold = strtoul(threshold_str, NULL, 10);
1466     } else {
1467         threshold = OFPROTO_FLOW_EVICTION_THRESHOLD_DEFAULT;
1468     }
1469     ofproto_set_flow_eviction_threshold(br->ofproto, threshold);
1470 }
1471
1472 /* Set forward BPDU option. */
1473 static void
1474 bridge_configure_forward_bpdu(struct bridge *br)
1475 {
1476     ofproto_set_forward_bpdu(br->ofproto,
1477                              smap_get_bool(&br->cfg->other_config,
1478                                            "forward-bpdu",
1479                                            false));
1480 }
1481
1482 /* Set MAC aging time for 'br'. */
1483 static void
1484 bridge_configure_mac_idle_time(struct bridge *br)
1485 {
1486     const char *idle_time_str;
1487     int idle_time;
1488
1489     idle_time_str = smap_get(&br->cfg->other_config, "mac-aging-time");
1490     idle_time = (idle_time_str && atoi(idle_time_str)
1491                  ? atoi(idle_time_str)
1492                  : MAC_ENTRY_DEFAULT_IDLE_TIME);
1493     ofproto_set_mac_idle_time(br->ofproto, idle_time);
1494 }
1495
1496 static void
1497 bridge_pick_local_hw_addr(struct bridge *br, uint8_t ea[ETH_ADDR_LEN],
1498                           struct iface **hw_addr_iface)
1499 {
1500     struct hmapx mirror_output_ports;
1501     const char *hwaddr;
1502     struct port *port;
1503     bool found_addr = false;
1504     int error;
1505     int i;
1506
1507     *hw_addr_iface = NULL;
1508
1509     /* Did the user request a particular MAC? */
1510     hwaddr = smap_get(&br->cfg->other_config, "hwaddr");
1511     if (hwaddr && eth_addr_from_string(hwaddr, ea)) {
1512         if (eth_addr_is_multicast(ea)) {
1513             VLOG_ERR("bridge %s: cannot set MAC address to multicast "
1514                      "address "ETH_ADDR_FMT, br->name, ETH_ADDR_ARGS(ea));
1515         } else if (eth_addr_is_zero(ea)) {
1516             VLOG_ERR("bridge %s: cannot set MAC address to zero", br->name);
1517         } else {
1518             return;
1519         }
1520     }
1521
1522     /* Mirror output ports don't participate in picking the local hardware
1523      * address.  ofproto can't help us find out whether a given port is a
1524      * mirror output because we haven't configured mirrors yet, so we need to
1525      * accumulate them ourselves. */
1526     hmapx_init(&mirror_output_ports);
1527     for (i = 0; i < br->cfg->n_mirrors; i++) {
1528         struct ovsrec_mirror *m = br->cfg->mirrors[i];
1529         if (m->output_port) {
1530             hmapx_add(&mirror_output_ports, m->output_port);
1531         }
1532     }
1533
1534     /* Otherwise choose the minimum non-local MAC address among all of the
1535      * interfaces. */
1536     HMAP_FOR_EACH (port, hmap_node, &br->ports) {
1537         uint8_t iface_ea[ETH_ADDR_LEN];
1538         struct iface *candidate;
1539         struct iface *iface;
1540
1541         /* Mirror output ports don't participate. */
1542         if (hmapx_contains(&mirror_output_ports, port->cfg)) {
1543             continue;
1544         }
1545
1546         /* Choose the MAC address to represent the port. */
1547         iface = NULL;
1548         if (port->cfg->mac && eth_addr_from_string(port->cfg->mac, iface_ea)) {
1549             /* Find the interface with this Ethernet address (if any) so that
1550              * we can provide the correct devname to the caller. */
1551             LIST_FOR_EACH (candidate, port_elem, &port->ifaces) {
1552                 uint8_t candidate_ea[ETH_ADDR_LEN];
1553                 if (!netdev_get_etheraddr(candidate->netdev, candidate_ea)
1554                     && eth_addr_equals(iface_ea, candidate_ea)) {
1555                     iface = candidate;
1556                 }
1557             }
1558         } else {
1559             /* Choose the interface whose MAC address will represent the port.
1560              * The Linux kernel bonding code always chooses the MAC address of
1561              * the first slave added to a bond, and the Fedora networking
1562              * scripts always add slaves to a bond in alphabetical order, so
1563              * for compatibility we choose the interface with the name that is
1564              * first in alphabetical order. */
1565             LIST_FOR_EACH (candidate, port_elem, &port->ifaces) {
1566                 if (!iface || strcmp(candidate->name, iface->name) < 0) {
1567                     iface = candidate;
1568                 }
1569             }
1570
1571             /* The local port doesn't count (since we're trying to choose its
1572              * MAC address anyway). */
1573             if (iface->ofp_port == OFPP_LOCAL) {
1574                 continue;
1575             }
1576
1577             /* Grab MAC. */
1578             error = netdev_get_etheraddr(iface->netdev, iface_ea);
1579             if (error) {
1580                 continue;
1581             }
1582         }
1583
1584         /* Compare against our current choice. */
1585         if (!eth_addr_is_multicast(iface_ea) &&
1586             !eth_addr_is_local(iface_ea) &&
1587             !eth_addr_is_reserved(iface_ea) &&
1588             !eth_addr_is_zero(iface_ea) &&
1589             (!found_addr || eth_addr_compare_3way(iface_ea, ea) < 0))
1590         {
1591             memcpy(ea, iface_ea, ETH_ADDR_LEN);
1592             *hw_addr_iface = iface;
1593             found_addr = true;
1594         }
1595     }
1596     if (found_addr) {
1597         VLOG_DBG("bridge %s: using bridge Ethernet address "ETH_ADDR_FMT,
1598                  br->name, ETH_ADDR_ARGS(ea));
1599     } else {
1600         static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 10);
1601         memcpy(ea, br->default_ea, ETH_ADDR_LEN);
1602         *hw_addr_iface = NULL;
1603         VLOG_WARN_RL(&rl, "bridge %s: using default bridge Ethernet "
1604                      "address "ETH_ADDR_FMT, br->name, ETH_ADDR_ARGS(ea));
1605     }
1606
1607     hmapx_destroy(&mirror_output_ports);
1608 }
1609
1610 /* Choose and returns the datapath ID for bridge 'br' given that the bridge
1611  * Ethernet address is 'bridge_ea'.  If 'bridge_ea' is the Ethernet address of
1612  * an interface on 'br', then that interface must be passed in as
1613  * 'hw_addr_iface'; if 'bridge_ea' was derived some other way, then
1614  * 'hw_addr_iface' must be passed in as a null pointer. */
1615 static uint64_t
1616 bridge_pick_datapath_id(struct bridge *br,
1617                         const uint8_t bridge_ea[ETH_ADDR_LEN],
1618                         struct iface *hw_addr_iface)
1619 {
1620     /*
1621      * The procedure for choosing a bridge MAC address will, in the most
1622      * ordinary case, also choose a unique MAC that we can use as a datapath
1623      * ID.  In some special cases, though, multiple bridges will end up with
1624      * the same MAC address.  This is OK for the bridges, but it will confuse
1625      * the OpenFlow controller, because each datapath needs a unique datapath
1626      * ID.
1627      *
1628      * Datapath IDs must be unique.  It is also very desirable that they be
1629      * stable from one run to the next, so that policy set on a datapath
1630      * "sticks".
1631      */
1632     const char *datapath_id;
1633     uint64_t dpid;
1634
1635     datapath_id = smap_get(&br->cfg->other_config, "datapath-id");
1636     if (datapath_id && dpid_from_string(datapath_id, &dpid)) {
1637         return dpid;
1638     }
1639
1640     if (!hw_addr_iface) {
1641         /*
1642          * A purely internal bridge, that is, one that has no non-virtual
1643          * network devices on it at all, is difficult because it has no
1644          * natural unique identifier at all.
1645          *
1646          * When the host is a XenServer, we handle this case by hashing the
1647          * host's UUID with the name of the bridge.  Names of bridges are
1648          * persistent across XenServer reboots, although they can be reused if
1649          * an internal network is destroyed and then a new one is later
1650          * created, so this is fairly effective.
1651          *
1652          * When the host is not a XenServer, we punt by using a random MAC
1653          * address on each run.
1654          */
1655         const char *host_uuid = xenserver_get_host_uuid();
1656         if (host_uuid) {
1657             char *combined = xasprintf("%s,%s", host_uuid, br->name);
1658             dpid = dpid_from_hash(combined, strlen(combined));
1659             free(combined);
1660             return dpid;
1661         }
1662     }
1663
1664     return eth_addr_to_uint64(bridge_ea);
1665 }
1666
1667 static uint64_t
1668 dpid_from_hash(const void *data, size_t n)
1669 {
1670     uint8_t hash[SHA1_DIGEST_SIZE];
1671
1672     BUILD_ASSERT_DECL(sizeof hash >= ETH_ADDR_LEN);
1673     sha1_bytes(data, n, hash);
1674     eth_addr_mark_random(hash);
1675     return eth_addr_to_uint64(hash);
1676 }
1677
1678 static void
1679 iface_refresh_status(struct iface *iface)
1680 {
1681     struct smap smap;
1682
1683     enum netdev_features current;
1684     int64_t bps;
1685     int mtu;
1686     int64_t mtu_64;
1687     int error;
1688
1689     if (iface_is_synthetic(iface)) {
1690         return;
1691     }
1692
1693     smap_init(&smap);
1694
1695     if (!netdev_get_drv_info(iface->netdev, &smap)) {
1696         ovsrec_interface_set_status(iface->cfg, &smap);
1697     } else {
1698         ovsrec_interface_set_status(iface->cfg, NULL);
1699     }
1700
1701     smap_destroy(&smap);
1702
1703     error = netdev_get_features(iface->netdev, &current, NULL, NULL, NULL);
1704     if (!error) {
1705         ovsrec_interface_set_duplex(iface->cfg,
1706                                     netdev_features_is_full_duplex(current)
1707                                     ? "full" : "half");
1708         /* warning: uint64_t -> int64_t conversion */
1709         bps = netdev_features_to_bps(current);
1710         ovsrec_interface_set_link_speed(iface->cfg, &bps, 1);
1711     }
1712     else {
1713         ovsrec_interface_set_duplex(iface->cfg, NULL);
1714         ovsrec_interface_set_link_speed(iface->cfg, NULL, 0);
1715     }
1716
1717     error = netdev_get_mtu(iface->netdev, &mtu);
1718     if (!error) {
1719         mtu_64 = mtu;
1720         ovsrec_interface_set_mtu(iface->cfg, &mtu_64, 1);
1721     }
1722     else {
1723         ovsrec_interface_set_mtu(iface->cfg, NULL, 0);
1724     }
1725 }
1726
1727 /* Writes 'iface''s CFM statistics to the database. 'iface' must not be
1728  * synthetic. */
1729 static void
1730 iface_refresh_cfm_stats(struct iface *iface)
1731 {
1732     const struct ovsrec_interface *cfg = iface->cfg;
1733     int fault, opup, error;
1734     const uint64_t *rmps;
1735     size_t n_rmps;
1736     int health;
1737
1738     fault = ofproto_port_get_cfm_fault(iface->port->bridge->ofproto,
1739                                        iface->ofp_port);
1740     if (fault >= 0) {
1741         const char *reasons[CFM_FAULT_N_REASONS];
1742         bool fault_bool = fault;
1743         size_t i, j;
1744
1745         j = 0;
1746         for (i = 0; i < CFM_FAULT_N_REASONS; i++) {
1747             int reason = 1 << i;
1748             if (fault & reason) {
1749                 reasons[j++] = cfm_fault_reason_to_str(reason);
1750             }
1751         }
1752
1753         ovsrec_interface_set_cfm_fault(cfg, &fault_bool, 1);
1754         ovsrec_interface_set_cfm_fault_status(cfg, (char **) reasons, j);
1755     } else {
1756         ovsrec_interface_set_cfm_fault(cfg, NULL, 0);
1757         ovsrec_interface_set_cfm_fault_status(cfg, NULL, 0);
1758     }
1759
1760     opup = ofproto_port_get_cfm_opup(iface->port->bridge->ofproto,
1761                                      iface->ofp_port);
1762     if (opup >= 0) {
1763         ovsrec_interface_set_cfm_remote_opstate(cfg, opup ? "up" : "down");
1764     } else {
1765         ovsrec_interface_set_cfm_remote_opstate(cfg, NULL);
1766     }
1767
1768     error = ofproto_port_get_cfm_remote_mpids(iface->port->bridge->ofproto,
1769                                               iface->ofp_port, &rmps, &n_rmps);
1770     if (error >= 0) {
1771         ovsrec_interface_set_cfm_remote_mpids(cfg, (const int64_t *)rmps,
1772                                               n_rmps);
1773     } else {
1774         ovsrec_interface_set_cfm_remote_mpids(cfg, NULL, 0);
1775     }
1776
1777     health = ofproto_port_get_cfm_health(iface->port->bridge->ofproto,
1778                                         iface->ofp_port);
1779     if (health >= 0) {
1780         int64_t cfm_health = health;
1781         ovsrec_interface_set_cfm_health(cfg, &cfm_health, 1);
1782     } else {
1783         ovsrec_interface_set_cfm_health(cfg, NULL, 0);
1784     }
1785 }
1786
1787 static void
1788 iface_refresh_stats(struct iface *iface)
1789 {
1790 #define IFACE_STATS                             \
1791     IFACE_STAT(rx_packets,      "rx_packets")   \
1792     IFACE_STAT(tx_packets,      "tx_packets")   \
1793     IFACE_STAT(rx_bytes,        "rx_bytes")     \
1794     IFACE_STAT(tx_bytes,        "tx_bytes")     \
1795     IFACE_STAT(rx_dropped,      "rx_dropped")   \
1796     IFACE_STAT(tx_dropped,      "tx_dropped")   \
1797     IFACE_STAT(rx_errors,       "rx_errors")    \
1798     IFACE_STAT(tx_errors,       "tx_errors")    \
1799     IFACE_STAT(rx_frame_errors, "rx_frame_err") \
1800     IFACE_STAT(rx_over_errors,  "rx_over_err")  \
1801     IFACE_STAT(rx_crc_errors,   "rx_crc_err")   \
1802     IFACE_STAT(collisions,      "collisions")
1803
1804 #define IFACE_STAT(MEMBER, NAME) NAME,
1805     static char *keys[] = { IFACE_STATS };
1806 #undef IFACE_STAT
1807     int64_t values[ARRAY_SIZE(keys)];
1808     int i;
1809
1810     struct netdev_stats stats;
1811
1812     if (iface_is_synthetic(iface)) {
1813         return;
1814     }
1815
1816     /* Intentionally ignore return value, since errors will set 'stats' to
1817      * all-1s, and we will deal with that correctly below. */
1818     netdev_get_stats(iface->netdev, &stats);
1819
1820     /* Copy statistics into values[] array. */
1821     i = 0;
1822 #define IFACE_STAT(MEMBER, NAME) values[i++] = stats.MEMBER;
1823     IFACE_STATS;
1824 #undef IFACE_STAT
1825     assert(i == ARRAY_SIZE(keys));
1826
1827     ovsrec_interface_set_statistics(iface->cfg, keys, values,
1828                                     ARRAY_SIZE(keys));
1829 #undef IFACE_STATS
1830 }
1831
1832 static void
1833 br_refresh_stp_status(struct bridge *br)
1834 {
1835     struct smap smap = SMAP_INITIALIZER(&smap);
1836     struct ofproto *ofproto = br->ofproto;
1837     struct ofproto_stp_status status;
1838
1839     if (ofproto_get_stp_status(ofproto, &status)) {
1840         return;
1841     }
1842
1843     if (!status.enabled) {
1844         ovsrec_bridge_set_status(br->cfg, NULL);
1845         return;
1846     }
1847
1848     smap_add_format(&smap, "stp_bridge_id", STP_ID_FMT,
1849                     STP_ID_ARGS(status.bridge_id));
1850     smap_add_format(&smap, "stp_designated_root", STP_ID_FMT,
1851                     STP_ID_ARGS(status.designated_root));
1852     smap_add_format(&smap, "stp_root_path_cost", "%d", status.root_path_cost);
1853
1854     ovsrec_bridge_set_status(br->cfg, &smap);
1855     smap_destroy(&smap);
1856 }
1857
1858 static void
1859 port_refresh_stp_status(struct port *port)
1860 {
1861     struct ofproto *ofproto = port->bridge->ofproto;
1862     struct iface *iface;
1863     struct ofproto_port_stp_status status;
1864     char *keys[3];
1865     int64_t int_values[3];
1866     struct smap smap;
1867
1868     if (port_is_synthetic(port)) {
1869         return;
1870     }
1871
1872     /* STP doesn't currently support bonds. */
1873     if (!list_is_singleton(&port->ifaces)) {
1874         ovsrec_port_set_status(port->cfg, NULL);
1875         return;
1876     }
1877
1878     iface = CONTAINER_OF(list_front(&port->ifaces), struct iface, port_elem);
1879
1880     if (ofproto_port_get_stp_status(ofproto, iface->ofp_port, &status)) {
1881         return;
1882     }
1883
1884     if (!status.enabled) {
1885         ovsrec_port_set_status(port->cfg, NULL);
1886         ovsrec_port_set_statistics(port->cfg, NULL, NULL, 0);
1887         return;
1888     }
1889
1890     /* Set Status column. */
1891     smap_init(&smap);
1892     smap_add_format(&smap, "stp_port_id", STP_PORT_ID_FMT, status.port_id);
1893     smap_add(&smap, "stp_state", stp_state_name(status.state));
1894     smap_add_format(&smap, "stp_sec_in_state", "%u", status.sec_in_state);
1895     smap_add(&smap, "stp_role", stp_role_name(status.role));
1896     ovsrec_port_set_status(port->cfg, &smap);
1897     smap_destroy(&smap);
1898
1899     /* Set Statistics column. */
1900     keys[0] = "stp_tx_count";
1901     int_values[0] = status.tx_count;
1902     keys[1] = "stp_rx_count";
1903     int_values[1] = status.rx_count;
1904     keys[2] = "stp_error_count";
1905     int_values[2] = status.error_count;
1906
1907     ovsrec_port_set_statistics(port->cfg, keys, int_values,
1908                                ARRAY_SIZE(int_values));
1909 }
1910
1911 static bool
1912 enable_system_stats(const struct ovsrec_open_vswitch *cfg)
1913 {
1914     return smap_get_bool(&cfg->other_config, "enable-statistics", false);
1915 }
1916
1917 static void
1918 reconfigure_system_stats(const struct ovsrec_open_vswitch *cfg)
1919 {
1920     bool enable = enable_system_stats(cfg);
1921
1922     system_stats_enable(enable);
1923     if (!enable) {
1924         ovsrec_open_vswitch_set_statistics(cfg, NULL);
1925     }
1926 }
1927
1928 static void
1929 run_system_stats(void)
1930 {
1931     const struct ovsrec_open_vswitch *cfg = ovsrec_open_vswitch_first(idl);
1932     struct smap *stats;
1933
1934     stats = system_stats_run();
1935     if (stats && cfg) {
1936         struct ovsdb_idl_txn *txn;
1937         struct ovsdb_datum datum;
1938
1939         txn = ovsdb_idl_txn_create(idl);
1940         ovsdb_datum_from_smap(&datum, stats);
1941         ovsdb_idl_txn_write(&cfg->header_, &ovsrec_open_vswitch_col_statistics,
1942                             &datum);
1943         ovsdb_idl_txn_commit(txn);
1944         ovsdb_idl_txn_destroy(txn);
1945
1946         free(stats);
1947     }
1948 }
1949
1950 static inline const char *
1951 nx_role_to_str(enum nx_role role)
1952 {
1953     switch (role) {
1954     case NX_ROLE_OTHER:
1955         return "other";
1956     case NX_ROLE_MASTER:
1957         return "master";
1958     case NX_ROLE_SLAVE:
1959         return "slave";
1960     default:
1961         return "*** INVALID ROLE ***";
1962     }
1963 }
1964
1965 static void
1966 refresh_controller_status(void)
1967 {
1968     struct bridge *br;
1969     struct shash info;
1970     const struct ovsrec_controller *cfg;
1971
1972     shash_init(&info);
1973
1974     /* Accumulate status for controllers on all bridges. */
1975     HMAP_FOR_EACH (br, node, &all_bridges) {
1976         ofproto_get_ofproto_controller_info(br->ofproto, &info);
1977     }
1978
1979     /* Update each controller in the database with current status. */
1980     OVSREC_CONTROLLER_FOR_EACH(cfg, idl) {
1981         struct ofproto_controller_info *cinfo =
1982             shash_find_data(&info, cfg->target);
1983
1984         if (cinfo) {
1985             struct smap smap = SMAP_INITIALIZER(&smap);
1986             const char **values = cinfo->pairs.values;
1987             const char **keys = cinfo->pairs.keys;
1988             size_t i;
1989
1990             for (i = 0; i < cinfo->pairs.n; i++) {
1991                 smap_add(&smap, keys[i], values[i]);
1992             }
1993
1994             ovsrec_controller_set_is_connected(cfg, cinfo->is_connected);
1995             ovsrec_controller_set_role(cfg, nx_role_to_str(cinfo->role));
1996             ovsrec_controller_set_status(cfg, &smap);
1997             smap_destroy(&smap);
1998         } else {
1999             ovsrec_controller_set_is_connected(cfg, false);
2000             ovsrec_controller_set_role(cfg, NULL);
2001             ovsrec_controller_set_status(cfg, NULL);
2002         }
2003     }
2004
2005     ofproto_free_ofproto_controller_info(&info);
2006 }
2007
2008 static void
2009 refresh_instant_stats(void)
2010 {
2011     static struct ovsdb_idl_txn *txn = NULL;
2012
2013     if (!txn) {
2014         struct bridge *br;
2015
2016         txn = ovsdb_idl_txn_create(idl);
2017
2018         HMAP_FOR_EACH (br, node, &all_bridges) {
2019             struct iface *iface;
2020             struct port *port;
2021
2022             br_refresh_stp_status(br);
2023
2024             HMAP_FOR_EACH (port, hmap_node, &br->ports) {
2025                 port_refresh_stp_status(port);
2026             }
2027
2028             HMAP_FOR_EACH (iface, name_node, &br->iface_by_name) {
2029                 enum netdev_flags flags;
2030                 const char *link_state;
2031                 int64_t link_resets;
2032                 int current, error;
2033
2034                 if (iface_is_synthetic(iface)) {
2035                     continue;
2036                 }
2037
2038                 current = ofproto_port_is_lacp_current(br->ofproto,
2039                                                        iface->ofp_port);
2040                 if (current >= 0) {
2041                     bool bl = current;
2042                     ovsrec_interface_set_lacp_current(iface->cfg, &bl, 1);
2043                 } else {
2044                     ovsrec_interface_set_lacp_current(iface->cfg, NULL, 0);
2045                 }
2046
2047                 error = netdev_get_flags(iface->netdev, &flags);
2048                 if (!error) {
2049                     const char *state = flags & NETDEV_UP ? "up" : "down";
2050                     ovsrec_interface_set_admin_state(iface->cfg, state);
2051                 } else {
2052                     ovsrec_interface_set_admin_state(iface->cfg, NULL);
2053                 }
2054
2055                 link_state = netdev_get_carrier(iface->netdev) ? "up" : "down";
2056                 ovsrec_interface_set_link_state(iface->cfg, link_state);
2057
2058                 link_resets = netdev_get_carrier_resets(iface->netdev);
2059                 ovsrec_interface_set_link_resets(iface->cfg, &link_resets, 1);
2060
2061                 iface_refresh_cfm_stats(iface);
2062             }
2063         }
2064     }
2065
2066     if (ovsdb_idl_txn_commit(txn) != TXN_INCOMPLETE) {
2067         ovsdb_idl_txn_destroy(txn);
2068         txn = NULL;
2069     }
2070 }
2071
2072 /* Performs periodic activity required by bridges that needs to be done with
2073  * the least possible latency.
2074  *
2075  * It makes sense to call this function a couple of times per poll loop, to
2076  * provide a significant performance boost on some benchmarks with ofprotos
2077  * that use the ofproto-dpif implementation. */
2078 void
2079 bridge_run_fast(void)
2080 {
2081     struct sset types;
2082     const char *type;
2083     struct bridge *br;
2084
2085     sset_init(&types);
2086     ofproto_enumerate_types(&types);
2087     SSET_FOR_EACH (type, &types) {
2088         ofproto_type_run_fast(type);
2089     }
2090     sset_destroy(&types);
2091
2092     HMAP_FOR_EACH (br, node, &all_bridges) {
2093         ofproto_run_fast(br->ofproto);
2094     }
2095 }
2096
2097 void
2098 bridge_run(void)
2099 {
2100     static const struct ovsrec_open_vswitch null_cfg;
2101     const struct ovsrec_open_vswitch *cfg;
2102     struct ovsdb_idl_txn *reconf_txn = NULL;
2103     struct sset types;
2104     const char *type;
2105
2106     bool vlan_splinters_changed;
2107     struct bridge *br;
2108
2109     ovsrec_open_vswitch_init((struct ovsrec_open_vswitch *) &null_cfg);
2110
2111     /* (Re)configure if necessary. */
2112     if (!reconfiguring) {
2113         ovsdb_idl_run(idl);
2114
2115         if (ovsdb_idl_is_lock_contended(idl)) {
2116             static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 1);
2117             struct bridge *br, *next_br;
2118
2119             VLOG_ERR_RL(&rl, "another ovs-vswitchd process is running, "
2120                         "disabling this process until it goes away");
2121
2122             HMAP_FOR_EACH_SAFE (br, next_br, node, &all_bridges) {
2123                 bridge_destroy(br);
2124             }
2125             return;
2126         } else if (!ovsdb_idl_has_lock(idl)) {
2127             return;
2128         }
2129     }
2130     cfg = ovsrec_open_vswitch_first(idl);
2131
2132     /* Initialize the ofproto library.  This only needs to run once, but
2133      * it must be done after the configuration is set.  If the
2134      * initialization has already occurred, bridge_init_ofproto()
2135      * returns immediately. */
2136     bridge_init_ofproto(cfg);
2137
2138     /* Let each datapath type do the work that it needs to do. */
2139     sset_init(&types);
2140     ofproto_enumerate_types(&types);
2141     SSET_FOR_EACH (type, &types) {
2142         ofproto_type_run(type);
2143     }
2144     sset_destroy(&types);
2145
2146     /* Let each bridge do the work that it needs to do. */
2147     HMAP_FOR_EACH (br, node, &all_bridges) {
2148         ofproto_run(br->ofproto);
2149     }
2150
2151     /* Re-configure SSL.  We do this on every trip through the main loop,
2152      * instead of just when the database changes, because the contents of the
2153      * key and certificate files can change without the database changing.
2154      *
2155      * We do this before bridge_reconfigure() because that function might
2156      * initiate SSL connections and thus requires SSL to be configured. */
2157     if (cfg && cfg->ssl) {
2158         const struct ovsrec_ssl *ssl = cfg->ssl;
2159
2160         stream_ssl_set_key_and_cert(ssl->private_key, ssl->certificate);
2161         stream_ssl_set_ca_cert_file(ssl->ca_cert, ssl->bootstrap_ca_cert);
2162     }
2163
2164     if (!reconfiguring) {
2165         /* If VLAN splinters are in use, then we need to reconfigure if VLAN
2166          * usage has changed. */
2167         vlan_splinters_changed = false;
2168         if (vlan_splinters_enabled_anywhere) {
2169             HMAP_FOR_EACH (br, node, &all_bridges) {
2170                 if (ofproto_has_vlan_usage_changed(br->ofproto)) {
2171                     vlan_splinters_changed = true;
2172                     break;
2173                 }
2174             }
2175         }
2176
2177         if (ovsdb_idl_get_seqno(idl) != idl_seqno || vlan_splinters_changed) {
2178             idl_seqno = ovsdb_idl_get_seqno(idl);
2179             if (cfg) {
2180                 reconf_txn = ovsdb_idl_txn_create(idl);
2181                 bridge_reconfigure(cfg);
2182             } else {
2183                 /* We still need to reconfigure to avoid dangling pointers to
2184                  * now-destroyed ovsrec structures inside bridge data. */
2185                 bridge_reconfigure(&null_cfg);
2186             }
2187         }
2188     }
2189
2190     if (reconfiguring) {
2191         if (cfg) {
2192             if (!reconf_txn) {
2193                 reconf_txn = ovsdb_idl_txn_create(idl);
2194             }
2195             if (bridge_reconfigure_continue(cfg)) {
2196                 ovsrec_open_vswitch_set_cur_cfg(cfg, cfg->next_cfg);
2197             }
2198         } else {
2199             bridge_reconfigure_continue(&null_cfg);
2200         }
2201     }
2202
2203     if (reconf_txn) {
2204         ovsdb_idl_txn_commit(reconf_txn);
2205         ovsdb_idl_txn_destroy(reconf_txn);
2206         reconf_txn = NULL;
2207     }
2208
2209     /* Refresh interface and mirror stats if necessary. */
2210     if (time_msec() >= iface_stats_timer) {
2211         if (cfg) {
2212             struct ovsdb_idl_txn *txn;
2213
2214             txn = ovsdb_idl_txn_create(idl);
2215             HMAP_FOR_EACH (br, node, &all_bridges) {
2216                 struct port *port;
2217                 struct mirror *m;
2218
2219                 HMAP_FOR_EACH (port, hmap_node, &br->ports) {
2220                     struct iface *iface;
2221
2222                     LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
2223                         iface_refresh_stats(iface);
2224                         iface_refresh_status(iface);
2225                     }
2226                 }
2227
2228                 HMAP_FOR_EACH (m, hmap_node, &br->mirrors) {
2229                     mirror_refresh_stats(m);
2230                 }
2231
2232             }
2233             refresh_controller_status();
2234             ovsdb_idl_txn_commit(txn);
2235             ovsdb_idl_txn_destroy(txn); /* XXX */
2236         }
2237
2238         iface_stats_timer = time_msec() + IFACE_STATS_INTERVAL;
2239     }
2240
2241     run_system_stats();
2242     refresh_instant_stats();
2243 }
2244
2245 void
2246 bridge_wait(void)
2247 {
2248     struct sset types;
2249     const char *type;
2250
2251     ovsdb_idl_wait(idl);
2252
2253     if (reconfiguring) {
2254         poll_immediate_wake();
2255     }
2256
2257     sset_init(&types);
2258     ofproto_enumerate_types(&types);
2259     SSET_FOR_EACH (type, &types) {
2260         ofproto_type_wait(type);
2261     }
2262     sset_destroy(&types);
2263
2264     if (!hmap_is_empty(&all_bridges)) {
2265         struct bridge *br;
2266
2267         HMAP_FOR_EACH (br, node, &all_bridges) {
2268             ofproto_wait(br->ofproto);
2269         }
2270         poll_timer_wait_until(iface_stats_timer);
2271     }
2272
2273     system_stats_wait();
2274 }
2275
2276 /* Adds some memory usage statistics for bridges into 'usage', for use with
2277  * memory_report(). */
2278 void
2279 bridge_get_memory_usage(struct simap *usage)
2280 {
2281     struct bridge *br;
2282
2283     HMAP_FOR_EACH (br, node, &all_bridges) {
2284         ofproto_get_memory_usage(br->ofproto, usage);
2285     }
2286 }
2287 \f
2288 /* QoS unixctl user interface functions. */
2289
2290 struct qos_unixctl_show_cbdata {
2291     struct ds *ds;
2292     struct iface *iface;
2293 };
2294
2295 static void
2296 qos_unixctl_show_cb(unsigned int queue_id,
2297                     const struct smap *details,
2298                     void *aux)
2299 {
2300     struct qos_unixctl_show_cbdata *data = aux;
2301     struct ds *ds = data->ds;
2302     struct iface *iface = data->iface;
2303     struct netdev_queue_stats stats;
2304     struct smap_node *node;
2305     int error;
2306
2307     ds_put_cstr(ds, "\n");
2308     if (queue_id) {
2309         ds_put_format(ds, "Queue %u:\n", queue_id);
2310     } else {
2311         ds_put_cstr(ds, "Default:\n");
2312     }
2313
2314     SMAP_FOR_EACH (node, details) {
2315         ds_put_format(ds, "\t%s: %s\n", node->key, node->value);
2316     }
2317
2318     error = netdev_get_queue_stats(iface->netdev, queue_id, &stats);
2319     if (!error) {
2320         if (stats.tx_packets != UINT64_MAX) {
2321             ds_put_format(ds, "\ttx_packets: %"PRIu64"\n", stats.tx_packets);
2322         }
2323
2324         if (stats.tx_bytes != UINT64_MAX) {
2325             ds_put_format(ds, "\ttx_bytes: %"PRIu64"\n", stats.tx_bytes);
2326         }
2327
2328         if (stats.tx_errors != UINT64_MAX) {
2329             ds_put_format(ds, "\ttx_errors: %"PRIu64"\n", stats.tx_errors);
2330         }
2331     } else {
2332         ds_put_format(ds, "\tFailed to get statistics for queue %u: %s",
2333                       queue_id, strerror(error));
2334     }
2335 }
2336
2337 static void
2338 qos_unixctl_show(struct unixctl_conn *conn, int argc OVS_UNUSED,
2339                  const char *argv[], void *aux OVS_UNUSED)
2340 {
2341     struct ds ds = DS_EMPTY_INITIALIZER;
2342     struct smap smap = SMAP_INITIALIZER(&smap);
2343     struct iface *iface;
2344     const char *type;
2345     struct smap_node *node;
2346     struct qos_unixctl_show_cbdata data;
2347     int error;
2348
2349     iface = iface_find(argv[1]);
2350     if (!iface) {
2351         unixctl_command_reply_error(conn, "no such interface");
2352         return;
2353     }
2354
2355     netdev_get_qos(iface->netdev, &type, &smap);
2356
2357     if (*type != '\0') {
2358         ds_put_format(&ds, "QoS: %s %s\n", iface->name, type);
2359
2360         SMAP_FOR_EACH (node, &smap) {
2361             ds_put_format(&ds, "%s: %s\n", node->key, node->value);
2362         }
2363
2364         data.ds = &ds;
2365         data.iface = iface;
2366         error = netdev_dump_queues(iface->netdev, qos_unixctl_show_cb, &data);
2367
2368         if (error) {
2369             ds_put_format(&ds, "failed to dump queues: %s", strerror(error));
2370         }
2371         unixctl_command_reply(conn, ds_cstr(&ds));
2372     } else {
2373         ds_put_format(&ds, "QoS not configured on %s\n", iface->name);
2374         unixctl_command_reply_error(conn, ds_cstr(&ds));
2375     }
2376
2377     smap_destroy(&smap);
2378     ds_destroy(&ds);
2379 }
2380 \f
2381 /* Bridge reconfiguration functions. */
2382 static void
2383 bridge_create(const struct ovsrec_bridge *br_cfg)
2384 {
2385     struct bridge *br;
2386
2387     assert(!bridge_lookup(br_cfg->name));
2388     br = xzalloc(sizeof *br);
2389
2390     br->name = xstrdup(br_cfg->name);
2391     br->type = xstrdup(ofproto_normalize_type(br_cfg->datapath_type));
2392     br->cfg = br_cfg;
2393
2394     /* Derive the default Ethernet address from the bridge's UUID.  This should
2395      * be unique and it will be stable between ovs-vswitchd runs.  */
2396     memcpy(br->default_ea, &br_cfg->header_.uuid, ETH_ADDR_LEN);
2397     eth_addr_mark_random(br->default_ea);
2398
2399     hmap_init(&br->ports);
2400     hmap_init(&br->ifaces);
2401     hmap_init(&br->iface_by_name);
2402     hmap_init(&br->mirrors);
2403
2404     hmap_init(&br->if_cfg_todo);
2405     list_init(&br->ofpp_garbage);
2406
2407     hmap_insert(&all_bridges, &br->node, hash_string(br->name, 0));
2408 }
2409
2410 static void
2411 bridge_destroy(struct bridge *br)
2412 {
2413     if (br) {
2414         struct mirror *mirror, *next_mirror;
2415         struct port *port, *next_port;
2416         struct if_cfg *if_cfg, *next_if_cfg;
2417         struct ofpp_garbage *garbage, *next_garbage;
2418
2419         HMAP_FOR_EACH_SAFE (port, next_port, hmap_node, &br->ports) {
2420             port_destroy(port);
2421         }
2422         HMAP_FOR_EACH_SAFE (mirror, next_mirror, hmap_node, &br->mirrors) {
2423             mirror_destroy(mirror);
2424         }
2425         HMAP_FOR_EACH_SAFE (if_cfg, next_if_cfg, hmap_node, &br->if_cfg_todo) {
2426             hmap_remove(&br->if_cfg_todo, &if_cfg->hmap_node);
2427             free(if_cfg);
2428         }
2429         LIST_FOR_EACH_SAFE (garbage, next_garbage, list_node,
2430                             &br->ofpp_garbage) {
2431             list_remove(&garbage->list_node);
2432             free(garbage);
2433         }
2434
2435         hmap_remove(&all_bridges, &br->node);
2436         ofproto_destroy(br->ofproto);
2437         hmap_destroy(&br->ifaces);
2438         hmap_destroy(&br->ports);
2439         hmap_destroy(&br->iface_by_name);
2440         hmap_destroy(&br->mirrors);
2441         hmap_destroy(&br->if_cfg_todo);
2442         free(br->name);
2443         free(br->type);
2444         free(br);
2445     }
2446 }
2447
2448 static struct bridge *
2449 bridge_lookup(const char *name)
2450 {
2451     struct bridge *br;
2452
2453     HMAP_FOR_EACH_WITH_HASH (br, node, hash_string(name, 0), &all_bridges) {
2454         if (!strcmp(br->name, name)) {
2455             return br;
2456         }
2457     }
2458     return NULL;
2459 }
2460
2461 /* Handle requests for a listing of all flows known by the OpenFlow
2462  * stack, including those normally hidden. */
2463 static void
2464 bridge_unixctl_dump_flows(struct unixctl_conn *conn, int argc OVS_UNUSED,
2465                           const char *argv[], void *aux OVS_UNUSED)
2466 {
2467     struct bridge *br;
2468     struct ds results;
2469
2470     br = bridge_lookup(argv[1]);
2471     if (!br) {
2472         unixctl_command_reply_error(conn, "Unknown bridge");
2473         return;
2474     }
2475
2476     ds_init(&results);
2477     ofproto_get_all_flows(br->ofproto, &results);
2478
2479     unixctl_command_reply(conn, ds_cstr(&results));
2480     ds_destroy(&results);
2481 }
2482
2483 /* "bridge/reconnect [BRIDGE]": makes BRIDGE drop all of its controller
2484  * connections and reconnect.  If BRIDGE is not specified, then all bridges
2485  * drop their controller connections and reconnect. */
2486 static void
2487 bridge_unixctl_reconnect(struct unixctl_conn *conn, int argc,
2488                          const char *argv[], void *aux OVS_UNUSED)
2489 {
2490     struct bridge *br;
2491     if (argc > 1) {
2492         br = bridge_lookup(argv[1]);
2493         if (!br) {
2494             unixctl_command_reply_error(conn,  "Unknown bridge");
2495             return;
2496         }
2497         ofproto_reconnect_controllers(br->ofproto);
2498     } else {
2499         HMAP_FOR_EACH (br, node, &all_bridges) {
2500             ofproto_reconnect_controllers(br->ofproto);
2501         }
2502     }
2503     unixctl_command_reply(conn, NULL);
2504 }
2505
2506 static size_t
2507 bridge_get_controllers(const struct bridge *br,
2508                        struct ovsrec_controller ***controllersp)
2509 {
2510     struct ovsrec_controller **controllers;
2511     size_t n_controllers;
2512
2513     controllers = br->cfg->controller;
2514     n_controllers = br->cfg->n_controller;
2515
2516     if (n_controllers == 1 && !strcmp(controllers[0]->target, "none")) {
2517         controllers = NULL;
2518         n_controllers = 0;
2519     }
2520
2521     if (controllersp) {
2522         *controllersp = controllers;
2523     }
2524     return n_controllers;
2525 }
2526
2527 static void
2528 bridge_queue_if_cfg(struct bridge *br,
2529                     const struct ovsrec_interface *cfg,
2530                     const struct ovsrec_port *parent)
2531 {
2532     struct if_cfg *if_cfg = xmalloc(sizeof *if_cfg);
2533
2534     if_cfg->cfg = cfg;
2535     if_cfg->parent = parent;
2536     if_cfg->ofport = cfg->n_ofport_request ? *cfg->ofport_request : OFPP_NONE;
2537     hmap_insert(&br->if_cfg_todo, &if_cfg->hmap_node,
2538                 hash_string(if_cfg->cfg->name, 0));
2539 }
2540
2541 /* Deletes "struct port"s and "struct iface"s under 'br' which aren't
2542  * consistent with 'br->cfg'.  Updates 'br->if_cfg_queue' with interfaces which
2543  * 'br' needs to complete its configuration. */
2544 static void
2545 bridge_add_del_ports(struct bridge *br,
2546                      const unsigned long int *splinter_vlans)
2547 {
2548     struct shash_node *port_node;
2549     struct port *port, *next;
2550     struct shash new_ports;
2551     size_t i;
2552
2553     assert(hmap_is_empty(&br->if_cfg_todo));
2554
2555     /* Collect new ports. */
2556     shash_init(&new_ports);
2557     for (i = 0; i < br->cfg->n_ports; i++) {
2558         const char *name = br->cfg->ports[i]->name;
2559         if (!shash_add_once(&new_ports, name, br->cfg->ports[i])) {
2560             VLOG_WARN("bridge %s: %s specified twice as bridge port",
2561                       br->name, name);
2562         }
2563     }
2564     if (bridge_get_controllers(br, NULL)
2565         && !shash_find(&new_ports, br->name)) {
2566         VLOG_WARN("bridge %s: no port named %s, synthesizing one",
2567                   br->name, br->name);
2568
2569         ovsrec_interface_init(&br->synth_local_iface);
2570         ovsrec_port_init(&br->synth_local_port);
2571
2572         br->synth_local_port.interfaces = &br->synth_local_ifacep;
2573         br->synth_local_port.n_interfaces = 1;
2574         br->synth_local_port.name = br->name;
2575
2576         br->synth_local_iface.name = br->name;
2577         br->synth_local_iface.type = "internal";
2578
2579         br->synth_local_ifacep = &br->synth_local_iface;
2580
2581         shash_add(&new_ports, br->name, &br->synth_local_port);
2582     }
2583
2584     if (splinter_vlans) {
2585         add_vlan_splinter_ports(br, splinter_vlans, &new_ports);
2586     }
2587
2588     /* Get rid of deleted ports.
2589      * Get rid of deleted interfaces on ports that still exist. */
2590     HMAP_FOR_EACH_SAFE (port, next, hmap_node, &br->ports) {
2591         port->cfg = shash_find_data(&new_ports, port->name);
2592         if (!port->cfg) {
2593             port_destroy(port);
2594         } else {
2595             port_del_ifaces(port);
2596         }
2597     }
2598
2599     /* Update iface->cfg and iface->type in interfaces that still exist.
2600      * Add new interfaces to creation queue. */
2601     SHASH_FOR_EACH (port_node, &new_ports) {
2602         const struct ovsrec_port *port = port_node->data;
2603         size_t i;
2604
2605         for (i = 0; i < port->n_interfaces; i++) {
2606             const struct ovsrec_interface *cfg = port->interfaces[i];
2607             struct iface *iface = iface_lookup(br, cfg->name);
2608             const char *type = iface_get_type(cfg, br->cfg);
2609
2610             if (iface) {
2611                 iface->cfg = cfg;
2612                 iface->type = type;
2613             } else if (!strcmp(type, "null")) {
2614                 VLOG_WARN_ONCE("%s: The null interface type is deprecated and"
2615                                " may be removed in February 2013. Please email"
2616                                " dev@openvswitch.org with concerns.",
2617                                cfg->name);
2618             } else {
2619                 bridge_queue_if_cfg(br, cfg, port);
2620             }
2621         }
2622     }
2623
2624     shash_destroy(&new_ports);
2625 }
2626
2627 /* Initializes 'oc' appropriately as a management service controller for
2628  * 'br'.
2629  *
2630  * The caller must free oc->target when it is no longer needed. */
2631 static void
2632 bridge_ofproto_controller_for_mgmt(const struct bridge *br,
2633                                    struct ofproto_controller *oc)
2634 {
2635     oc->target = xasprintf("punix:%s/%s.mgmt", ovs_rundir(), br->name);
2636     oc->max_backoff = 0;
2637     oc->probe_interval = 60;
2638     oc->band = OFPROTO_OUT_OF_BAND;
2639     oc->rate_limit = 0;
2640     oc->burst_limit = 0;
2641     oc->enable_async_msgs = true;
2642 }
2643
2644 /* Converts ovsrec_controller 'c' into an ofproto_controller in 'oc'.  */
2645 static void
2646 bridge_ofproto_controller_from_ovsrec(const struct ovsrec_controller *c,
2647                                       struct ofproto_controller *oc)
2648 {
2649     int dscp;
2650
2651     oc->target = c->target;
2652     oc->max_backoff = c->max_backoff ? *c->max_backoff / 1000 : 8;
2653     oc->probe_interval = c->inactivity_probe ? *c->inactivity_probe / 1000 : 5;
2654     oc->band = (!c->connection_mode || !strcmp(c->connection_mode, "in-band")
2655                 ? OFPROTO_IN_BAND : OFPROTO_OUT_OF_BAND);
2656     oc->rate_limit = c->controller_rate_limit ? *c->controller_rate_limit : 0;
2657     oc->burst_limit = (c->controller_burst_limit
2658                        ? *c->controller_burst_limit : 0);
2659     oc->enable_async_msgs = (!c->enable_async_messages
2660                              || *c->enable_async_messages);
2661     dscp = smap_get_int(&c->other_config, "dscp", DSCP_DEFAULT);
2662     if (dscp < 0 || dscp > 63) {
2663         dscp = DSCP_DEFAULT;
2664     }
2665     oc->dscp = dscp;
2666 }
2667
2668 /* Configures the IP stack for 'br''s local interface properly according to the
2669  * configuration in 'c'.  */
2670 static void
2671 bridge_configure_local_iface_netdev(struct bridge *br,
2672                                     struct ovsrec_controller *c)
2673 {
2674     struct netdev *netdev;
2675     struct in_addr mask, gateway;
2676
2677     struct iface *local_iface;
2678     struct in_addr ip;
2679
2680     /* If there's no local interface or no IP address, give up. */
2681     local_iface = iface_from_ofp_port(br, OFPP_LOCAL);
2682     if (!local_iface || !c->local_ip || !inet_aton(c->local_ip, &ip)) {
2683         return;
2684     }
2685
2686     /* Bring up the local interface. */
2687     netdev = local_iface->netdev;
2688     netdev_turn_flags_on(netdev, NETDEV_UP, true);
2689
2690     /* Configure the IP address and netmask. */
2691     if (!c->local_netmask
2692         || !inet_aton(c->local_netmask, &mask)
2693         || !mask.s_addr) {
2694         mask.s_addr = guess_netmask(ip.s_addr);
2695     }
2696     if (!netdev_set_in4(netdev, ip, mask)) {
2697         VLOG_INFO("bridge %s: configured IP address "IP_FMT", netmask "IP_FMT,
2698                   br->name, IP_ARGS(&ip.s_addr), IP_ARGS(&mask.s_addr));
2699     }
2700
2701     /* Configure the default gateway. */
2702     if (c->local_gateway
2703         && inet_aton(c->local_gateway, &gateway)
2704         && gateway.s_addr) {
2705         if (!netdev_add_router(netdev, gateway)) {
2706             VLOG_INFO("bridge %s: configured gateway "IP_FMT,
2707                       br->name, IP_ARGS(&gateway.s_addr));
2708         }
2709     }
2710 }
2711
2712 /* Returns true if 'a' and 'b' are the same except that any number of slashes
2713  * in either string are treated as equal to any number of slashes in the other,
2714  * e.g. "x///y" is equal to "x/y". */
2715 static bool
2716 equal_pathnames(const char *a, const char *b)
2717 {
2718     while (*a == *b) {
2719         if (*a == '/') {
2720             a += strspn(a, "/");
2721             b += strspn(b, "/");
2722         } else if (*a == '\0') {
2723             return true;
2724         } else {
2725             a++;
2726             b++;
2727         }
2728     }
2729     return false;
2730 }
2731
2732 static void
2733 bridge_configure_remotes(struct bridge *br,
2734                          const struct sockaddr_in *managers, size_t n_managers)
2735 {
2736     bool disable_in_band;
2737
2738     struct ovsrec_controller **controllers;
2739     size_t n_controllers;
2740
2741     enum ofproto_fail_mode fail_mode;
2742
2743     struct ofproto_controller *ocs;
2744     size_t n_ocs;
2745     size_t i;
2746
2747     /* Check if we should disable in-band control on this bridge. */
2748     disable_in_band = smap_get_bool(&br->cfg->other_config, "disable-in-band",
2749                                     false);
2750
2751     /* Set OpenFlow queue ID for in-band control. */
2752     ofproto_set_in_band_queue(br->ofproto,
2753                               smap_get_int(&br->cfg->other_config,
2754                                            "in-band-queue", -1));
2755
2756     if (disable_in_band) {
2757         ofproto_set_extra_in_band_remotes(br->ofproto, NULL, 0);
2758     } else {
2759         ofproto_set_extra_in_band_remotes(br->ofproto, managers, n_managers);
2760     }
2761
2762     n_controllers = bridge_get_controllers(br, &controllers);
2763
2764     ocs = xmalloc((n_controllers + 1) * sizeof *ocs);
2765     n_ocs = 0;
2766
2767     bridge_ofproto_controller_for_mgmt(br, &ocs[n_ocs++]);
2768     for (i = 0; i < n_controllers; i++) {
2769         struct ovsrec_controller *c = controllers[i];
2770
2771         if (!strncmp(c->target, "punix:", 6)
2772             || !strncmp(c->target, "unix:", 5)) {
2773             static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 5);
2774             char *whitelist;
2775
2776             whitelist = xasprintf("unix:%s/%s.controller",
2777                                   ovs_rundir(), br->name);
2778             if (!equal_pathnames(c->target, whitelist)) {
2779                 /* Prevent remote ovsdb-server users from accessing arbitrary
2780                  * Unix domain sockets and overwriting arbitrary local
2781                  * files. */
2782                 VLOG_ERR_RL(&rl, "bridge %s: Not adding Unix domain socket "
2783                             "controller \"%s\" due to possibility for remote "
2784                             "exploit.  Instead, specify whitelisted \"%s\" or "
2785                             "connect to \"unix:%s/%s.mgmt\" (which is always "
2786                             "available without special configuration).",
2787                             br->name, c->target, whitelist,
2788                             ovs_rundir(), br->name);
2789                 free(whitelist);
2790                 continue;
2791             }
2792
2793             free(whitelist);
2794         }
2795
2796         bridge_configure_local_iface_netdev(br, c);
2797         bridge_ofproto_controller_from_ovsrec(c, &ocs[n_ocs]);
2798         if (disable_in_band) {
2799             ocs[n_ocs].band = OFPROTO_OUT_OF_BAND;
2800         }
2801         n_ocs++;
2802     }
2803
2804     ofproto_set_controllers(br->ofproto, ocs, n_ocs);
2805     free(ocs[0].target); /* From bridge_ofproto_controller_for_mgmt(). */
2806     free(ocs);
2807
2808     /* Set the fail-mode. */
2809     fail_mode = !br->cfg->fail_mode
2810                 || !strcmp(br->cfg->fail_mode, "standalone")
2811                     ? OFPROTO_FAIL_STANDALONE
2812                     : OFPROTO_FAIL_SECURE;
2813     ofproto_set_fail_mode(br->ofproto, fail_mode);
2814
2815     /* Configure OpenFlow controller connection snooping. */
2816     if (!ofproto_has_snoops(br->ofproto)) {
2817         struct sset snoops;
2818
2819         sset_init(&snoops);
2820         sset_add_and_free(&snoops, xasprintf("punix:%s/%s.snoop",
2821                                              ovs_rundir(), br->name));
2822         ofproto_set_snoops(br->ofproto, &snoops);
2823         sset_destroy(&snoops);
2824     }
2825 }
2826
2827 static void
2828 bridge_configure_tables(struct bridge *br)
2829 {
2830     static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 5);
2831     int n_tables;
2832     int i, j;
2833
2834     n_tables = ofproto_get_n_tables(br->ofproto);
2835     j = 0;
2836     for (i = 0; i < n_tables; i++) {
2837         struct ofproto_table_settings s;
2838
2839         s.name = NULL;
2840         s.max_flows = UINT_MAX;
2841         s.groups = NULL;
2842         s.n_groups = 0;
2843
2844         if (j < br->cfg->n_flow_tables && i == br->cfg->key_flow_tables[j]) {
2845             struct ovsrec_flow_table *cfg = br->cfg->value_flow_tables[j++];
2846
2847             s.name = cfg->name;
2848             if (cfg->n_flow_limit && *cfg->flow_limit < UINT_MAX) {
2849                 s.max_flows = *cfg->flow_limit;
2850             }
2851             if (cfg->overflow_policy
2852                 && !strcmp(cfg->overflow_policy, "evict")) {
2853                 size_t k;
2854
2855                 s.groups = xmalloc(cfg->n_groups * sizeof *s.groups);
2856                 for (k = 0; k < cfg->n_groups; k++) {
2857                     const char *string = cfg->groups[k];
2858                     char *msg;
2859
2860                     msg = mf_parse_subfield__(&s.groups[k], &string);
2861                     if (msg) {
2862                         VLOG_WARN_RL(&rl, "bridge %s table %d: error parsing "
2863                                      "'groups' (%s)", br->name, i, msg);
2864                         free(msg);
2865                     } else if (*string) {
2866                         VLOG_WARN_RL(&rl, "bridge %s table %d: 'groups' "
2867                                      "element '%s' contains trailing garbage",
2868                                      br->name, i, cfg->groups[k]);
2869                     } else {
2870                         s.n_groups++;
2871                     }
2872                 }
2873             }
2874         }
2875
2876         ofproto_configure_table(br->ofproto, i, &s);
2877
2878         free(s.groups);
2879     }
2880     for (; j < br->cfg->n_flow_tables; j++) {
2881         VLOG_WARN_RL(&rl, "bridge %s: ignoring configuration for flow table "
2882                      "%"PRId64" not supported by this datapath", br->name,
2883                      br->cfg->key_flow_tables[j]);
2884     }
2885 }
2886 \f
2887 /* Port functions. */
2888
2889 static struct port *
2890 port_create(struct bridge *br, const struct ovsrec_port *cfg)
2891 {
2892     struct port *port;
2893
2894     port = xzalloc(sizeof *port);
2895     port->bridge = br;
2896     port->name = xstrdup(cfg->name);
2897     port->cfg = cfg;
2898     list_init(&port->ifaces);
2899
2900     hmap_insert(&br->ports, &port->hmap_node, hash_string(port->name, 0));
2901     return port;
2902 }
2903
2904 /* Deletes interfaces from 'port' that are no longer configured for it. */
2905 static void
2906 port_del_ifaces(struct port *port)
2907 {
2908     struct iface *iface, *next;
2909     struct sset new_ifaces;
2910     size_t i;
2911
2912     /* Collect list of new interfaces. */
2913     sset_init(&new_ifaces);
2914     for (i = 0; i < port->cfg->n_interfaces; i++) {
2915         const char *name = port->cfg->interfaces[i]->name;
2916         const char *type = port->cfg->interfaces[i]->type;
2917         if (strcmp(type, "null")) {
2918             sset_add(&new_ifaces, name);
2919         }
2920     }
2921
2922     /* Get rid of deleted interfaces. */
2923     LIST_FOR_EACH_SAFE (iface, next, port_elem, &port->ifaces) {
2924         if (!sset_contains(&new_ifaces, iface->name)) {
2925             iface_destroy(iface);
2926         }
2927     }
2928
2929     sset_destroy(&new_ifaces);
2930 }
2931
2932 static void
2933 port_destroy(struct port *port)
2934 {
2935     if (port) {
2936         struct bridge *br = port->bridge;
2937         struct iface *iface, *next;
2938
2939         if (br->ofproto) {
2940             ofproto_bundle_unregister(br->ofproto, port);
2941         }
2942
2943         LIST_FOR_EACH_SAFE (iface, next, port_elem, &port->ifaces) {
2944             iface_destroy(iface);
2945         }
2946
2947         hmap_remove(&br->ports, &port->hmap_node);
2948         free(port->name);
2949         free(port);
2950     }
2951 }
2952
2953 static struct port *
2954 port_lookup(const struct bridge *br, const char *name)
2955 {
2956     struct port *port;
2957
2958     HMAP_FOR_EACH_WITH_HASH (port, hmap_node, hash_string(name, 0),
2959                              &br->ports) {
2960         if (!strcmp(port->name, name)) {
2961             return port;
2962         }
2963     }
2964     return NULL;
2965 }
2966
2967 static bool
2968 enable_lacp(struct port *port, bool *activep)
2969 {
2970     if (!port->cfg->lacp) {
2971         /* XXX when LACP implementation has been sufficiently tested, enable by
2972          * default and make active on bonded ports. */
2973         return false;
2974     } else if (!strcmp(port->cfg->lacp, "off")) {
2975         return false;
2976     } else if (!strcmp(port->cfg->lacp, "active")) {
2977         *activep = true;
2978         return true;
2979     } else if (!strcmp(port->cfg->lacp, "passive")) {
2980         *activep = false;
2981         return true;
2982     } else {
2983         VLOG_WARN("port %s: unknown LACP mode %s",
2984                   port->name, port->cfg->lacp);
2985         return false;
2986     }
2987 }
2988
2989 static struct lacp_settings *
2990 port_configure_lacp(struct port *port, struct lacp_settings *s)
2991 {
2992     const char *lacp_time, *system_id;
2993     int priority;
2994
2995     if (!enable_lacp(port, &s->active)) {
2996         return NULL;
2997     }
2998
2999     s->name = port->name;
3000
3001     system_id = smap_get(&port->cfg->other_config, "lacp-system-id");
3002     if (system_id) {
3003         if (sscanf(system_id, ETH_ADDR_SCAN_FMT,
3004                    ETH_ADDR_SCAN_ARGS(s->id)) != ETH_ADDR_SCAN_COUNT) {
3005             VLOG_WARN("port %s: LACP system ID (%s) must be an Ethernet"
3006                       " address.", port->name, system_id);
3007             return NULL;
3008         }
3009     } else {
3010         memcpy(s->id, port->bridge->ea, ETH_ADDR_LEN);
3011     }
3012
3013     if (eth_addr_is_zero(s->id)) {
3014         VLOG_WARN("port %s: Invalid zero LACP system ID.", port->name);
3015         return NULL;
3016     }
3017
3018     /* Prefer bondable links if unspecified. */
3019     priority = smap_get_int(&port->cfg->other_config, "lacp-system-priority",
3020                             0);
3021     s->priority = (priority > 0 && priority <= UINT16_MAX
3022                    ? priority
3023                    : UINT16_MAX - !list_is_short(&port->ifaces));
3024
3025     lacp_time = smap_get(&port->cfg->other_config, "lacp-time");
3026     s->fast = lacp_time && !strcasecmp(lacp_time, "fast");
3027     return s;
3028 }
3029
3030 static void
3031 iface_configure_lacp(struct iface *iface, struct lacp_slave_settings *s)
3032 {
3033     int priority, portid, key;
3034
3035     portid = smap_get_int(&iface->cfg->other_config, "lacp-port-id", 0);
3036     priority = smap_get_int(&iface->cfg->other_config, "lacp-port-priority",
3037                             0);
3038     key = smap_get_int(&iface->cfg->other_config, "lacp-aggregation-key", 0);
3039
3040     if (portid <= 0 || portid > UINT16_MAX) {
3041         portid = iface->ofp_port;
3042     }
3043
3044     if (priority <= 0 || priority > UINT16_MAX) {
3045         priority = UINT16_MAX;
3046     }
3047
3048     if (key < 0 || key > UINT16_MAX) {
3049         key = 0;
3050     }
3051
3052     s->name = iface->name;
3053     s->id = portid;
3054     s->priority = priority;
3055     s->key = key;
3056 }
3057
3058 static void
3059 port_configure_bond(struct port *port, struct bond_settings *s,
3060                     uint32_t *bond_stable_ids)
3061 {
3062     const char *detect_s;
3063     struct iface *iface;
3064     int miimon_interval;
3065     size_t i;
3066
3067     s->name = port->name;
3068     s->balance = BM_AB;
3069     if (port->cfg->bond_mode) {
3070         if (!bond_mode_from_string(&s->balance, port->cfg->bond_mode)) {
3071             VLOG_WARN("port %s: unknown bond_mode %s, defaulting to %s",
3072                       port->name, port->cfg->bond_mode,
3073                       bond_mode_to_string(s->balance));
3074         }
3075     } else {
3076         static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(1, 1);
3077
3078         /* XXX: Post version 1.5.*, the default bond_mode changed from SLB to
3079          * active-backup. At some point we should remove this warning. */
3080         VLOG_WARN_RL(&rl, "port %s: Using the default bond_mode %s. Note that"
3081                      " in previous versions, the default bond_mode was"
3082                      " balance-slb", port->name,
3083                      bond_mode_to_string(s->balance));
3084     }
3085     if (s->balance == BM_SLB && port->bridge->cfg->n_flood_vlans) {
3086         VLOG_WARN("port %s: SLB bonds are incompatible with flood_vlans, "
3087                   "please use another bond type or disable flood_vlans",
3088                   port->name);
3089     }
3090
3091     miimon_interval = smap_get_int(&port->cfg->other_config,
3092                                    "bond-miimon-interval", 0);
3093     if (miimon_interval <= 0) {
3094         miimon_interval = 200;
3095     }
3096
3097     detect_s = smap_get(&port->cfg->other_config, "bond-detect-mode");
3098     if (!detect_s || !strcmp(detect_s, "carrier")) {
3099         miimon_interval = 0;
3100     } else if (strcmp(detect_s, "miimon")) {
3101         VLOG_WARN("port %s: unsupported bond-detect-mode %s, "
3102                   "defaulting to carrier", port->name, detect_s);
3103         miimon_interval = 0;
3104     }
3105
3106     s->up_delay = MAX(0, port->cfg->bond_updelay);
3107     s->down_delay = MAX(0, port->cfg->bond_downdelay);
3108     s->basis = smap_get_int(&port->cfg->other_config, "bond-hash-basis", 0);
3109     s->rebalance_interval = smap_get_int(&port->cfg->other_config,
3110                                            "bond-rebalance-interval", 10000);
3111     if (s->rebalance_interval && s->rebalance_interval < 1000) {
3112         s->rebalance_interval = 1000;
3113     }
3114
3115     s->fake_iface = port->cfg->bond_fake_iface;
3116
3117     i = 0;
3118     LIST_FOR_EACH (iface, port_elem, &port->ifaces) {
3119         long long stable_id;
3120
3121         stable_id = smap_get_int(&iface->cfg->other_config, "bond-stable-id",
3122                                  0);
3123         if (stable_id <= 0 || stable_id >= UINT32_MAX) {
3124             stable_id = iface->ofp_port;
3125         }
3126         bond_stable_ids[i++] = stable_id;
3127
3128         netdev_set_miimon_interval(iface->netdev, miimon_interval);
3129     }
3130 }
3131
3132 /* Returns true if 'port' is synthetic, that is, if we constructed it locally
3133  * instead of obtaining it from the database. */
3134 static bool
3135 port_is_synthetic(const struct port *port)
3136 {
3137     return ovsdb_idl_row_is_synthetic(&port->cfg->header_);
3138 }
3139 \f
3140 /* Interface functions. */
3141
3142 /* Returns the correct network device type for interface 'iface' in bridge
3143  * 'br'. */
3144 static const char *
3145 iface_get_type(const struct ovsrec_interface *iface,
3146                const struct ovsrec_bridge *br)
3147 {
3148     /* The local port always has type "internal" unless the bridge is of
3149      * type "dummy".  Other ports take their type from the database and
3150      * default to "system" if none is specified. */
3151     if (!strcmp(iface->name, br->name)) {
3152         return !strcmp(br->datapath_type, "dummy") ? "dummy" : "internal";
3153     } else {
3154         return iface->type[0] ? iface->type : "system";
3155     }
3156 }
3157
3158 static void
3159 iface_destroy(struct iface *iface)
3160 {
3161     if (iface) {
3162         struct port *port = iface->port;
3163         struct bridge *br = port->bridge;
3164
3165         if (br->ofproto && iface->ofp_port >= 0) {
3166             ofproto_port_unregister(br->ofproto, iface->ofp_port);
3167         }
3168
3169         if (iface->ofp_port >= 0) {
3170             hmap_remove(&br->ifaces, &iface->ofp_port_node);
3171         }
3172
3173         list_remove(&iface->port_elem);
3174         hmap_remove(&br->iface_by_name, &iface->name_node);
3175
3176         netdev_close(iface->netdev);
3177
3178         free(iface->name);
3179         free(iface);
3180     }
3181 }
3182
3183 static struct iface *
3184 iface_lookup(const struct bridge *br, const char *name)
3185 {
3186     struct iface *iface;
3187
3188     HMAP_FOR_EACH_WITH_HASH (iface, name_node, hash_string(name, 0),
3189                              &br->iface_by_name) {
3190         if (!strcmp(iface->name, name)) {
3191             return iface;
3192         }
3193     }
3194
3195     return NULL;
3196 }
3197
3198 static struct iface *
3199 iface_find(const char *name)
3200 {
3201     const struct bridge *br;
3202
3203     HMAP_FOR_EACH (br, node, &all_bridges) {
3204         struct iface *iface = iface_lookup(br, name);
3205
3206         if (iface) {
3207             return iface;
3208         }
3209     }
3210     return NULL;
3211 }
3212
3213 static struct if_cfg *
3214 if_cfg_lookup(const struct bridge *br, const char *name)
3215 {
3216     struct if_cfg *if_cfg;
3217
3218     HMAP_FOR_EACH_WITH_HASH (if_cfg, hmap_node, hash_string(name, 0),
3219                              &br->if_cfg_todo) {
3220         if (!strcmp(if_cfg->cfg->name, name)) {
3221             return if_cfg;
3222         }
3223     }
3224
3225     return NULL;
3226 }
3227
3228 static struct iface *
3229 iface_from_ofp_port(const struct bridge *br, uint16_t ofp_port)
3230 {
3231     struct iface *iface;
3232
3233     HMAP_FOR_EACH_IN_BUCKET (iface, ofp_port_node,
3234                              hash_int(ofp_port, 0), &br->ifaces) {
3235         if (iface->ofp_port == ofp_port) {
3236             return iface;
3237         }
3238     }
3239     return NULL;
3240 }
3241
3242 /* Set Ethernet address of 'iface', if one is specified in the configuration
3243  * file. */
3244 static void
3245 iface_set_mac(struct iface *iface)
3246 {
3247     uint8_t ea[ETH_ADDR_LEN];
3248
3249     if (!strcmp(iface->type, "internal")
3250         && iface->cfg->mac && eth_addr_from_string(iface->cfg->mac, ea)) {
3251         if (iface->ofp_port == OFPP_LOCAL) {
3252             VLOG_ERR("interface %s: ignoring mac in Interface record "
3253                      "(use Bridge record to set local port's mac)",
3254                      iface->name);
3255         } else if (eth_addr_is_multicast(ea)) {
3256             VLOG_ERR("interface %s: cannot set MAC to multicast address",
3257                      iface->name);
3258         } else {
3259             int error = netdev_set_etheraddr(iface->netdev, ea);
3260             if (error) {
3261                 VLOG_ERR("interface %s: setting MAC failed (%s)",
3262                          iface->name, strerror(error));
3263             }
3264         }
3265     }
3266 }
3267
3268 /* Sets the ofport column of 'if_cfg' to 'ofport'. */
3269 static void
3270 iface_set_ofport(const struct ovsrec_interface *if_cfg, int64_t ofport)
3271 {
3272     if (if_cfg && !ovsdb_idl_row_is_synthetic(&if_cfg->header_)) {
3273         ovsrec_interface_set_ofport(if_cfg, &ofport, 1);
3274     }
3275 }
3276
3277 /* Clears all of the fields in 'if_cfg' that indicate interface status, and
3278  * sets the "ofport" field to -1.
3279  *
3280  * This is appropriate when 'if_cfg''s interface cannot be created or is
3281  * otherwise invalid. */
3282 static void
3283 iface_clear_db_record(const struct ovsrec_interface *if_cfg)
3284 {
3285     if (!ovsdb_idl_row_is_synthetic(&if_cfg->header_)) {
3286         iface_set_ofport(if_cfg, -1);
3287         ovsrec_interface_set_status(if_cfg, NULL);
3288         ovsrec_interface_set_admin_state(if_cfg, NULL);
3289         ovsrec_interface_set_duplex(if_cfg, NULL);
3290         ovsrec_interface_set_link_speed(if_cfg, NULL, 0);
3291         ovsrec_interface_set_link_state(if_cfg, NULL);
3292         ovsrec_interface_set_mtu(if_cfg, NULL, 0);
3293         ovsrec_interface_set_cfm_fault(if_cfg, NULL, 0);
3294         ovsrec_interface_set_cfm_fault_status(if_cfg, NULL, 0);
3295         ovsrec_interface_set_cfm_remote_mpids(if_cfg, NULL, 0);
3296         ovsrec_interface_set_lacp_current(if_cfg, NULL, 0);
3297         ovsrec_interface_set_statistics(if_cfg, NULL, NULL, 0);
3298     }
3299 }
3300
3301 struct iface_delete_queues_cbdata {
3302     struct netdev *netdev;
3303     const struct ovsdb_datum *queues;
3304 };
3305
3306 static bool
3307 queue_ids_include(const struct ovsdb_datum *queues, int64_t target)
3308 {
3309     union ovsdb_atom atom;
3310
3311     atom.integer = target;
3312     return ovsdb_datum_find_key(queues, &atom, OVSDB_TYPE_INTEGER) != UINT_MAX;
3313 }
3314
3315 static void
3316 iface_delete_queues(unsigned int queue_id,
3317                     const struct smap *details OVS_UNUSED, void *cbdata_)
3318 {
3319     struct iface_delete_queues_cbdata *cbdata = cbdata_;
3320
3321     if (!queue_ids_include(cbdata->queues, queue_id)) {
3322         netdev_delete_queue(cbdata->netdev, queue_id);
3323     }
3324 }
3325
3326 static void
3327 iface_configure_qos(struct iface *iface, const struct ovsrec_qos *qos)
3328 {
3329     struct ofpbuf queues_buf;
3330
3331     ofpbuf_init(&queues_buf, 0);
3332
3333     if (!qos || qos->type[0] == '\0' || qos->n_queues < 1) {
3334         netdev_set_qos(iface->netdev, NULL, NULL);
3335     } else {
3336         struct iface_delete_queues_cbdata cbdata;
3337         bool queue_zero;
3338         size_t i;
3339
3340         /* Configure top-level Qos for 'iface'. */
3341         netdev_set_qos(iface->netdev, qos->type, &qos->other_config);
3342
3343         /* Deconfigure queues that were deleted. */
3344         cbdata.netdev = iface->netdev;
3345         cbdata.queues = ovsrec_qos_get_queues(qos, OVSDB_TYPE_INTEGER,
3346                                               OVSDB_TYPE_UUID);
3347         netdev_dump_queues(iface->netdev, iface_delete_queues, &cbdata);
3348
3349         /* Configure queues for 'iface'. */
3350         queue_zero = false;
3351         for (i = 0; i < qos->n_queues; i++) {
3352             const struct ovsrec_queue *queue = qos->value_queues[i];
3353             unsigned int queue_id = qos->key_queues[i];
3354
3355             if (queue_id == 0) {
3356                 queue_zero = true;
3357             }
3358
3359             if (queue->n_dscp == 1) {
3360                 struct ofproto_port_queue *port_queue;
3361
3362                 port_queue = ofpbuf_put_uninit(&queues_buf,
3363                                                sizeof *port_queue);
3364                 port_queue->queue = queue_id;
3365                 port_queue->dscp = queue->dscp[0];
3366             }
3367
3368             netdev_set_queue(iface->netdev, queue_id, &queue->other_config);
3369         }
3370         if (!queue_zero) {
3371             struct smap details;
3372
3373             smap_init(&details);
3374             netdev_set_queue(iface->netdev, 0, &details);
3375             smap_destroy(&details);
3376         }
3377     }
3378
3379     if (iface->ofp_port >= 0) {
3380         const struct ofproto_port_queue *port_queues = queues_buf.data;
3381         size_t n_queues = queues_buf.size / sizeof *port_queues;
3382
3383         ofproto_port_set_queues(iface->port->bridge->ofproto, iface->ofp_port,
3384                                 port_queues, n_queues);
3385     }
3386
3387     netdev_set_policing(iface->netdev,
3388                         iface->cfg->ingress_policing_rate,
3389                         iface->cfg->ingress_policing_burst);
3390
3391     ofpbuf_uninit(&queues_buf);
3392 }
3393
3394 static void
3395 iface_configure_cfm(struct iface *iface)
3396 {
3397     const struct ovsrec_interface *cfg = iface->cfg;
3398     const char *opstate_str;
3399     const char *cfm_ccm_vlan;
3400     struct cfm_settings s;
3401     struct smap netdev_args;
3402
3403     if (!cfg->n_cfm_mpid) {
3404         ofproto_port_clear_cfm(iface->port->bridge->ofproto, iface->ofp_port);
3405         return;
3406     }
3407
3408     s.check_tnl_key = false;
3409     smap_init(&netdev_args);
3410     if (!netdev_get_config(iface->netdev, &netdev_args)) {
3411         const char *key = smap_get(&netdev_args, "key");
3412         const char *in_key = smap_get(&netdev_args, "in_key");
3413
3414         s.check_tnl_key = (key && !strcmp(key, "flow"))
3415                            || (in_key && !strcmp(in_key, "flow"));
3416     }
3417     smap_destroy(&netdev_args);
3418
3419     s.mpid = *cfg->cfm_mpid;
3420     s.interval = smap_get_int(&iface->cfg->other_config, "cfm_interval", 0);
3421     cfm_ccm_vlan = smap_get(&iface->cfg->other_config, "cfm_ccm_vlan");
3422     s.ccm_pcp = smap_get_int(&iface->cfg->other_config, "cfm_ccm_pcp", 0);
3423
3424     if (s.interval <= 0) {
3425         s.interval = 1000;
3426     }
3427
3428     if (!cfm_ccm_vlan) {
3429         s.ccm_vlan = 0;
3430     } else if (!strcasecmp("random", cfm_ccm_vlan)) {
3431         s.ccm_vlan = CFM_RANDOM_VLAN;
3432     } else {
3433         s.ccm_vlan = atoi(cfm_ccm_vlan);
3434         if (s.ccm_vlan == CFM_RANDOM_VLAN) {
3435             s.ccm_vlan = 0;
3436         }
3437     }
3438
3439     s.extended = smap_get_bool(&iface->cfg->other_config, "cfm_extended",
3440                                false);
3441
3442     opstate_str = smap_get(&iface->cfg->other_config, "cfm_opstate");
3443     s.opup = !opstate_str || !strcasecmp("up", opstate_str);
3444
3445     ofproto_port_set_cfm(iface->port->bridge->ofproto, iface->ofp_port, &s);
3446 }
3447
3448 /* Returns true if 'iface' is synthetic, that is, if we constructed it locally
3449  * instead of obtaining it from the database. */
3450 static bool
3451 iface_is_synthetic(const struct iface *iface)
3452 {
3453     return ovsdb_idl_row_is_synthetic(&iface->cfg->header_);
3454 }
3455
3456 \f
3457 /* Port mirroring. */
3458
3459 static struct mirror *
3460 mirror_find_by_uuid(struct bridge *br, const struct uuid *uuid)
3461 {
3462     struct mirror *m;
3463
3464     HMAP_FOR_EACH_IN_BUCKET (m, hmap_node, uuid_hash(uuid), &br->mirrors) {
3465         if (uuid_equals(uuid, &m->uuid)) {
3466             return m;
3467         }
3468     }
3469     return NULL;
3470 }
3471
3472 static void
3473 bridge_configure_mirrors(struct bridge *br)
3474 {
3475     const struct ovsdb_datum *mc;
3476     unsigned long *flood_vlans;
3477     struct mirror *m, *next;
3478     size_t i;
3479
3480     /* Get rid of deleted mirrors. */
3481     mc = ovsrec_bridge_get_mirrors(br->cfg, OVSDB_TYPE_UUID);
3482     HMAP_FOR_EACH_SAFE (m, next, hmap_node, &br->mirrors) {
3483         union ovsdb_atom atom;
3484
3485         atom.uuid = m->uuid;
3486         if (ovsdb_datum_find_key(mc, &atom, OVSDB_TYPE_UUID) == UINT_MAX) {
3487             mirror_destroy(m);
3488         }
3489     }
3490
3491     /* Add new mirrors and reconfigure existing ones. */
3492     for (i = 0; i < br->cfg->n_mirrors; i++) {
3493         const struct ovsrec_mirror *cfg = br->cfg->mirrors[i];
3494         struct mirror *m = mirror_find_by_uuid(br, &cfg->header_.uuid);
3495         if (!m) {
3496             m = mirror_create(br, cfg);
3497         }
3498         m->cfg = cfg;
3499         if (!mirror_configure(m)) {
3500             mirror_destroy(m);
3501         }
3502     }
3503
3504     /* Update flooded vlans (for RSPAN). */
3505     flood_vlans = vlan_bitmap_from_array(br->cfg->flood_vlans,
3506                                          br->cfg->n_flood_vlans);
3507     ofproto_set_flood_vlans(br->ofproto, flood_vlans);
3508     bitmap_free(flood_vlans);
3509 }
3510
3511 static struct mirror *
3512 mirror_create(struct bridge *br, const struct ovsrec_mirror *cfg)
3513 {
3514     struct mirror *m;
3515
3516     m = xzalloc(sizeof *m);
3517     m->uuid = cfg->header_.uuid;
3518     hmap_insert(&br->mirrors, &m->hmap_node, uuid_hash(&m->uuid));
3519     m->bridge = br;
3520     m->name = xstrdup(cfg->name);
3521
3522     return m;
3523 }
3524
3525 static void
3526 mirror_destroy(struct mirror *m)
3527 {
3528     if (m) {
3529         struct bridge *br = m->bridge;
3530
3531         if (br->ofproto) {
3532             ofproto_mirror_unregister(br->ofproto, m);
3533         }
3534
3535         hmap_remove(&br->mirrors, &m->hmap_node);
3536         free(m->name);
3537         free(m);
3538     }
3539 }
3540
3541 static void
3542 mirror_collect_ports(struct mirror *m,
3543                      struct ovsrec_port **in_ports, int n_in_ports,
3544                      void ***out_portsp, size_t *n_out_portsp)
3545 {
3546     void **out_ports = xmalloc(n_in_ports * sizeof *out_ports);
3547     size_t n_out_ports = 0;
3548     size_t i;
3549
3550     for (i = 0; i < n_in_ports; i++) {
3551         const char *name = in_ports[i]->name;
3552         struct port *port = port_lookup(m->bridge, name);
3553         if (port) {
3554             out_ports[n_out_ports++] = port;
3555         } else {
3556             VLOG_WARN("bridge %s: mirror %s cannot match on nonexistent "
3557                       "port %s", m->bridge->name, m->name, name);
3558         }
3559     }
3560     *out_portsp = out_ports;
3561     *n_out_portsp = n_out_ports;
3562 }
3563
3564 static bool
3565 mirror_configure(struct mirror *m)
3566 {
3567     const struct ovsrec_mirror *cfg = m->cfg;
3568     struct ofproto_mirror_settings s;
3569
3570     /* Set name. */
3571     if (strcmp(cfg->name, m->name)) {
3572         free(m->name);
3573         m->name = xstrdup(cfg->name);
3574     }
3575     s.name = m->name;
3576
3577     /* Get output port or VLAN. */
3578     if (cfg->output_port) {
3579         s.out_bundle = port_lookup(m->bridge, cfg->output_port->name);
3580         if (!s.out_bundle) {
3581             VLOG_ERR("bridge %s: mirror %s outputs to port not on bridge",
3582                      m->bridge->name, m->name);
3583             return false;
3584         }
3585         s.out_vlan = UINT16_MAX;
3586
3587         if (cfg->output_vlan) {
3588             VLOG_ERR("bridge %s: mirror %s specifies both output port and "
3589                      "output vlan; ignoring output vlan",
3590                      m->bridge->name, m->name);
3591         }
3592     } else if (cfg->output_vlan) {
3593         /* The database should prevent invalid VLAN values. */
3594         s.out_bundle = NULL;
3595         s.out_vlan = *cfg->output_vlan;
3596     } else {
3597         VLOG_ERR("bridge %s: mirror %s does not specify output; ignoring",
3598                  m->bridge->name, m->name);
3599         return false;
3600     }
3601
3602     /* Get port selection. */
3603     if (cfg->select_all) {
3604         size_t n_ports = hmap_count(&m->bridge->ports);
3605         void **ports = xmalloc(n_ports * sizeof *ports);
3606         struct port *port;
3607         size_t i;
3608
3609         i = 0;
3610         HMAP_FOR_EACH (port, hmap_node, &m->bridge->ports) {
3611             ports[i++] = port;
3612         }
3613
3614         s.srcs = ports;
3615         s.n_srcs = n_ports;
3616
3617         s.dsts = ports;
3618         s.n_dsts = n_ports;
3619     } else {
3620         /* Get ports, dropping ports that don't exist.
3621          * The IDL ensures that there are no duplicates. */
3622         mirror_collect_ports(m, cfg->select_src_port, cfg->n_select_src_port,
3623                              &s.srcs, &s.n_srcs);
3624         mirror_collect_ports(m, cfg->select_dst_port, cfg->n_select_dst_port,
3625                              &s.dsts, &s.n_dsts);
3626     }
3627
3628     /* Get VLAN selection. */
3629     s.src_vlans = vlan_bitmap_from_array(cfg->select_vlan, cfg->n_select_vlan);
3630
3631     /* Configure. */
3632     ofproto_mirror_register(m->bridge->ofproto, m, &s);
3633
3634     /* Clean up. */
3635     if (s.srcs != s.dsts) {
3636         free(s.dsts);
3637     }
3638     free(s.srcs);
3639     free(s.src_vlans);
3640
3641     return true;
3642 }
3643 \f
3644 /* Linux VLAN device support (e.g. "eth0.10" for VLAN 10.)
3645  *
3646  * This is deprecated.  It is only for compatibility with broken device drivers
3647  * in old versions of Linux that do not properly support VLANs when VLAN
3648  * devices are not used.  When broken device drivers are no longer in
3649  * widespread use, we will delete these interfaces. */
3650
3651 static struct ovsrec_port **recs;
3652 static size_t n_recs, allocated_recs;
3653
3654 /* Adds 'rec' to a list of recs that have to be destroyed when the VLAN
3655  * splinters are reconfigured. */
3656 static void
3657 register_rec(struct ovsrec_port *rec)
3658 {
3659     if (n_recs >= allocated_recs) {
3660         recs = x2nrealloc(recs, &allocated_recs, sizeof *recs);
3661     }
3662     recs[n_recs++] = rec;
3663 }
3664
3665 /* Frees all of the ports registered with register_reg(). */
3666 static void
3667 free_registered_recs(void)
3668 {
3669     size_t i;
3670
3671     for (i = 0; i < n_recs; i++) {
3672         struct ovsrec_port *port = recs[i];
3673         size_t j;
3674
3675         for (j = 0; j < port->n_interfaces; j++) {
3676             struct ovsrec_interface *iface = port->interfaces[j];
3677             free(iface->name);
3678             free(iface);
3679         }
3680
3681         smap_destroy(&port->other_config);
3682         free(port->interfaces);
3683         free(port->name);
3684         free(port->tag);
3685         free(port);
3686     }
3687     n_recs = 0;
3688 }
3689
3690 /* Returns true if VLAN splinters are enabled on 'iface_cfg', false
3691  * otherwise. */
3692 static bool
3693 vlan_splinters_is_enabled(const struct ovsrec_interface *iface_cfg)
3694 {
3695     return smap_get_bool(&iface_cfg->other_config, "enable-vlan-splinters",
3696                          false);
3697 }
3698
3699 /* Figures out the set of VLANs that are in use for the purpose of VLAN
3700  * splinters.
3701  *
3702  * If VLAN splinters are enabled on at least one interface and any VLANs are in
3703  * use, returns a 4096-bit bitmap with a 1-bit for each in-use VLAN (bits 0 and
3704  * 4095 will not be set).  The caller is responsible for freeing the bitmap,
3705  * with free().
3706  *
3707  * If VLANs splinters are not enabled on any interface or if no VLANs are in
3708  * use, returns NULL.
3709  *
3710  * Updates 'vlan_splinters_enabled_anywhere'. */
3711 static unsigned long int *
3712 collect_splinter_vlans(const struct ovsrec_open_vswitch *ovs_cfg)
3713 {
3714     unsigned long int *splinter_vlans;
3715     struct sset splinter_ifaces;
3716     const char *real_dev_name;
3717     struct shash *real_devs;
3718     struct shash_node *node;
3719     struct bridge *br;
3720     size_t i;
3721
3722     /* Free space allocated for synthesized ports and interfaces, since we're
3723      * in the process of reconstructing all of them. */
3724     free_registered_recs();
3725
3726     splinter_vlans = bitmap_allocate(4096);
3727     sset_init(&splinter_ifaces);
3728     vlan_splinters_enabled_anywhere = false;
3729     for (i = 0; i < ovs_cfg->n_bridges; i++) {
3730         struct ovsrec_bridge *br_cfg = ovs_cfg->bridges[i];
3731         size_t j;
3732
3733         for (j = 0; j < br_cfg->n_ports; j++) {
3734             struct ovsrec_port *port_cfg = br_cfg->ports[j];
3735             int k;
3736
3737             for (k = 0; k < port_cfg->n_interfaces; k++) {
3738                 struct ovsrec_interface *iface_cfg = port_cfg->interfaces[k];
3739
3740                 if (vlan_splinters_is_enabled(iface_cfg)) {
3741                     vlan_splinters_enabled_anywhere = true;
3742                     sset_add(&splinter_ifaces, iface_cfg->name);
3743                     vlan_bitmap_from_array__(port_cfg->trunks,
3744                                              port_cfg->n_trunks,
3745                                              splinter_vlans);
3746                 }
3747             }
3748
3749             if (port_cfg->tag && *port_cfg->tag > 0 && *port_cfg->tag < 4095) {
3750                 bitmap_set1(splinter_vlans, *port_cfg->tag);
3751             }
3752         }
3753     }
3754
3755     if (!vlan_splinters_enabled_anywhere) {
3756         free(splinter_vlans);
3757         sset_destroy(&splinter_ifaces);
3758         return NULL;
3759     }
3760
3761     HMAP_FOR_EACH (br, node, &all_bridges) {
3762         if (br->ofproto) {
3763             ofproto_get_vlan_usage(br->ofproto, splinter_vlans);
3764         }
3765     }
3766
3767     /* Don't allow VLANs 0 or 4095 to be splintered.  VLAN 0 should appear on
3768      * the real device.  VLAN 4095 is reserved and Linux doesn't allow a VLAN
3769      * device to be created for it. */
3770     bitmap_set0(splinter_vlans, 0);
3771     bitmap_set0(splinter_vlans, 4095);
3772
3773     /* Delete all VLAN devices that we don't need. */
3774     vlandev_refresh();
3775     real_devs = vlandev_get_real_devs();
3776     SHASH_FOR_EACH (node, real_devs) {
3777         const struct vlan_real_dev *real_dev = node->data;
3778         const struct vlan_dev *vlan_dev;
3779         bool real_dev_has_splinters;
3780
3781         real_dev_has_splinters = sset_contains(&splinter_ifaces,
3782                                                real_dev->name);
3783         HMAP_FOR_EACH (vlan_dev, hmap_node, &real_dev->vlan_devs) {
3784             if (!real_dev_has_splinters
3785                 || !bitmap_is_set(splinter_vlans, vlan_dev->vid)) {
3786                 struct netdev *netdev;
3787
3788                 if (!netdev_open(vlan_dev->name, "system", &netdev)) {
3789                     if (!netdev_get_in4(netdev, NULL, NULL) ||
3790                         !netdev_get_in6(netdev, NULL)) {
3791                         vlandev_del(vlan_dev->name);
3792                     } else {
3793                         /* It has an IP address configured, so we don't own
3794                          * it.  Don't delete it. */
3795                     }
3796                     netdev_close(netdev);
3797                 }
3798             }
3799
3800         }
3801     }
3802
3803     /* Add all VLAN devices that we need. */
3804     SSET_FOR_EACH (real_dev_name, &splinter_ifaces) {
3805         int vid;
3806
3807         BITMAP_FOR_EACH_1 (vid, 4096, splinter_vlans) {
3808             if (!vlandev_get_name(real_dev_name, vid)) {
3809                 vlandev_add(real_dev_name, vid);
3810             }
3811         }
3812     }
3813
3814     vlandev_refresh();
3815
3816     sset_destroy(&splinter_ifaces);
3817
3818     if (bitmap_scan(splinter_vlans, 0, 4096) >= 4096) {
3819         free(splinter_vlans);
3820         return NULL;
3821     }
3822     return splinter_vlans;
3823 }
3824
3825 /* Pushes the configure of VLAN splinter port 'port' (e.g. eth0.9) down to
3826  * ofproto.  */
3827 static void
3828 configure_splinter_port(struct port *port)
3829 {
3830     struct ofproto *ofproto = port->bridge->ofproto;
3831     uint16_t realdev_ofp_port;
3832     const char *realdev_name;
3833     struct iface *vlandev, *realdev;
3834
3835     ofproto_bundle_unregister(port->bridge->ofproto, port);
3836
3837     vlandev = CONTAINER_OF(list_front(&port->ifaces), struct iface,
3838                            port_elem);
3839
3840     realdev_name = smap_get(&port->cfg->other_config, "realdev");
3841     realdev = iface_lookup(port->bridge, realdev_name);
3842     realdev_ofp_port = realdev ? realdev->ofp_port : 0;
3843
3844     ofproto_port_set_realdev(ofproto, vlandev->ofp_port, realdev_ofp_port,
3845                              *port->cfg->tag);
3846 }
3847
3848 static struct ovsrec_port *
3849 synthesize_splinter_port(const char *real_dev_name,
3850                          const char *vlan_dev_name, int vid)
3851 {
3852     struct ovsrec_interface *iface;
3853     struct ovsrec_port *port;
3854
3855     iface = xmalloc(sizeof *iface);
3856     ovsrec_interface_init(iface);
3857     iface->name = xstrdup(vlan_dev_name);
3858     iface->type = "system";
3859
3860     port = xmalloc(sizeof *port);
3861     ovsrec_port_init(port);
3862     port->interfaces = xmemdup(&iface, sizeof iface);
3863     port->n_interfaces = 1;
3864     port->name = xstrdup(vlan_dev_name);
3865     port->vlan_mode = "splinter";
3866     port->tag = xmalloc(sizeof *port->tag);
3867     *port->tag = vid;
3868
3869     smap_add(&port->other_config, "realdev", real_dev_name);
3870
3871     register_rec(port);
3872     return port;
3873 }
3874
3875 /* For each interface with 'br' that has VLAN splinters enabled, adds a
3876  * corresponding ovsrec_port to 'ports' for each splinter VLAN marked with a
3877  * 1-bit in the 'splinter_vlans' bitmap. */
3878 static void
3879 add_vlan_splinter_ports(struct bridge *br,
3880                         const unsigned long int *splinter_vlans,
3881                         struct shash *ports)
3882 {
3883     size_t i;
3884
3885     /* We iterate through 'br->cfg->ports' instead of 'ports' here because
3886      * we're modifying 'ports'. */
3887     for (i = 0; i < br->cfg->n_ports; i++) {
3888         const char *name = br->cfg->ports[i]->name;
3889         struct ovsrec_port *port_cfg = shash_find_data(ports, name);
3890         size_t j;
3891
3892         for (j = 0; j < port_cfg->n_interfaces; j++) {
3893             struct ovsrec_interface *iface_cfg = port_cfg->interfaces[j];
3894
3895             if (vlan_splinters_is_enabled(iface_cfg)) {
3896                 const char *real_dev_name;
3897                 uint16_t vid;
3898
3899                 real_dev_name = iface_cfg->name;
3900                 BITMAP_FOR_EACH_1 (vid, 4096, splinter_vlans) {
3901                     const char *vlan_dev_name;
3902
3903                     vlan_dev_name = vlandev_get_name(real_dev_name, vid);
3904                     if (vlan_dev_name
3905                         && !shash_find(ports, vlan_dev_name)) {
3906                         shash_add(ports, vlan_dev_name,
3907                                   synthesize_splinter_port(
3908                                       real_dev_name, vlan_dev_name, vid));
3909                     }
3910                 }
3911             }
3912         }
3913     }
3914 }
3915
3916 static void
3917 mirror_refresh_stats(struct mirror *m)
3918 {
3919     struct ofproto *ofproto = m->bridge->ofproto;
3920     uint64_t tx_packets, tx_bytes;
3921     char *keys[2];
3922     int64_t values[2];
3923     size_t stat_cnt = 0;
3924
3925     if (ofproto_mirror_get_stats(ofproto, m, &tx_packets, &tx_bytes)) {
3926         ovsrec_mirror_set_statistics(m->cfg, NULL, NULL, 0);
3927         return;
3928     }
3929
3930     if (tx_packets != UINT64_MAX) {
3931         keys[stat_cnt] = "tx_packets";
3932         values[stat_cnt] = tx_packets;
3933         stat_cnt++;
3934     }
3935     if (tx_bytes != UINT64_MAX) {
3936         keys[stat_cnt] = "tx_bytes";
3937         values[stat_cnt] = tx_bytes;
3938         stat_cnt++;
3939     }
3940
3941     ovsrec_mirror_set_statistics(m->cfg, keys, values, stat_cnt);
3942 }