Ben Pfaff [Wed, 31 Dec 2008 00:02:17 +0000 (16:02 -0800)]
 
vswitchd: Add support for remote controller.
Ben Pfaff [Tue, 30 Dec 2008 23:26:33 +0000 (15:26 -0800)]
 
Fix bug in make_add_simple_flow() that busts secchan's in-band control.
Ben Pfaff [Tue, 30 Dec 2008 21:53:18 +0000 (13:53 -0800)]
 
vswitchd: Don't try to delete local port from datapath.
The local port (OFFP_LOCAL) is fixed in place and can't be deleted, so
don't try.
Ben Pfaff [Tue, 30 Dec 2008 21:40:10 +0000 (13:40 -0800)]
 
brcompat: Remove line-length limitations from brc_modify_config().
Ben Pfaff [Tue, 30 Dec 2008 21:25:35 +0000 (13:25 -0800)]
 
brcompat: Write temporary file to same directory as config file.
Otherwise, we will write it in the current working directory, which will
be / if we're running as a daemon (see daemonize()).  We shouldn't assume
that we can write to that directory, and it might not be in the same
file system as the output file anyhow.
Ben Pfaff [Tue, 30 Dec 2008 21:12:48 +0000 (13:12 -0800)]
 
New function nl_sock_wait(), to improve netlink socket abstraction.
Ben Pfaff [Tue, 30 Dec 2008 21:03:48 +0000 (13:03 -0800)]
 
Properly lock dp_mutex around changes to the datapath.
We weren't locking dp_mutex() here but it really is necessary.  See the
comment on dp_mutex itself for details.
This actually restores some of the locking removed by commit 
47b8652d
"Simplify use of dp_mutex."  That commit is correct that we can take
dp_mutex at a high level in dp_genl_openflow(), but it removes locking
from functions that are not called through dp_genl_openflow(): in
particular any Netlink command other than DP_GENL_C_OPENFLOW does not
go through that function, so those commands need to acquire the mutex
themselves.
Ben Pfaff [Tue, 30 Dec 2008 20:50:02 +0000 (12:50 -0800)]
 
brcompat: Fix usage message.
--brcompat isn't required and doesn't substitute for --config, so put it
in a different section.
Ben Pfaff [Tue, 30 Dec 2008 20:49:23 +0000 (12:49 -0800)]
 
brcompat: Add note about required kernel module to vswitchd manpage.
Ben Pfaff [Tue, 30 Dec 2008 20:40:11 +0000 (12:40 -0800)]
 
Simplify lookup_dp() now that we can assume that dp_name is null-terminated.
Ben Pfaff [Tue, 30 Dec 2008 20:34:39 +0000 (12:34 -0800)]
 
Force DP_GENL_A_DP_NAME and DP_GENL_A_PORTNAME to be null-terminated.
The kernel doesn't check for a null terminator on strings in Netlink
attributes unless you force it to do so.
Ben Pfaff [Tue, 30 Dec 2008 20:33:11 +0000 (12:33 -0800)]
 
Factor datapath common code into new function lookup_dp().
Ben Pfaff [Tue, 30 Dec 2008 19:40:22 +0000 (11:40 -0800)]
 
Fix GNU make warning about overriding commands for a target.
We would add a target to link a C file into datapath directories each
time that file was mentioned in a list of sources, so when we put a source
file into two different lists of sources it got two such targets.  Fixed
by using the GNU make $(sort) function to eliminate duplicates.
Ben Pfaff [Tue, 30 Dec 2008 19:32:23 +0000 (11:32 -0800)]
 
Update dpif comments and prototypes.
Some of the comments weren't up-to-date, and the prototypes are easier
to understand if parameter names are included.
Ben Pfaff [Tue, 30 Dec 2008 19:31:25 +0000 (11:31 -0800)]
 
Restore openflow-netlink.h ABI.
Inserting DP_GENL_A_DP_NAME above DP_GENL_A_PORTNAME in commit
660f6596ba31, "First cut at bridge compatibility for vswitchd" forces users
not to use any existing builds of userspace utilities, because the
numbering of all the netlink attributes for OpenFlow has changed.  This
change restores the numbering and should make older dpctl, etc. still able
to work.
Ben Pfaff [Tue, 30 Dec 2008 19:23:36 +0000 (11:23 -0800)]
 
Use rcu_dereference() before we dereference an RCU-protected pointer.
The access to dps[i]->netdev->name is a dereference that should be
protected by rcu_dereference().
Ben Pfaff [Tue, 30 Dec 2008 18:48:59 +0000 (10:48 -0800)]
 
Fix off-by-one error in looking up datapaths by index.
Justin Pettit [Tue, 30 Dec 2008 19:23:34 +0000 (11:23 -0800)]
 
Fix missing symbol in brcompat kernel module on older kernels.
In kernels older than 2.6.23, the genl_register_mc_group function is not
defined, so we fake it.  The original checkin didn't build the C file
that contains the function's definition.
Justin Pettit [Tue, 30 Dec 2008 18:55:33 +0000 (10:55 -0800)]
 
Increase max datapaths to 256 (Bug #561).
Increase the maximum number of datapaths from 32 to 256.  This ought to
be enough for anyone.
Ben Pfaff [Tue, 30 Dec 2008 18:26:03 +0000 (10:26 -0800)]
 
brcompat: Build brcompat module only under Linux 2.6.
brcompat fails to compile under Linux 2.4 due to the lack of brioctl_set()
and other symbols, but there's no intention of supporting Linux 2.4 for it
anyhow, so don't build it under Linux 2.4.
Ben Pfaff [Tue, 30 Dec 2008 18:25:50 +0000 (10:25 -0800)]
 
brcompat: Remove policy from Netlink code.
Policies are only useful for data that is received by a Netlink socket.
They do not apply to data that is sent out.  Since this code does not
parse the messages that it receives at all, it does not need any policy.
Ben Pfaff [Tue, 30 Dec 2008 18:25:38 +0000 (10:25 -0800)]
 
brcompat: Fix typo in user message.
Ben Pfaff [Tue, 30 Dec 2008 18:25:29 +0000 (10:25 -0800)]
 
brcompat: Indentation fixups.
In a few places four spaces were used in place of one tab. Elsewhere,
function arguments weren't lined up well.
Ben Pfaff [Tue, 30 Dec 2008 18:01:06 +0000 (10:01 -0800)]
 
Make datapath compile with Xen kernel.
The Xen kernel is based on 2.6.18 but backports many features from later
kernels.  It is not always possible, therefore, to detect whether we need
to use compatibility code based on LINUX_VERSION_CODE.  This commit fixes
the problem by using configure-time tests to check for the need for the
compatibility code.
Build-tested on Linux 2.6.15 through 2.6.28 with the default configuration
(except that some kernels needed preemption turned off) and with Xen
kernel 2.6.18-92.1.10.el5.xs5.0.0.394.644.
Fixes bug #548.
Justin Pettit [Tue, 30 Dec 2008 06:53:08 +0000 (22:53 -0800)]
 
First cut at bridge compatibility for vswitchd.
This set of changes allows the bridge ioctls to be used for adding and
removing datapaths and interfaces.  To enable, one must insmod the
new "brcompat_mod.ko" kernel module.  Then, vswitchd is run with the
"--brcompat" flag.  See the man page for vswitchd for more details.
Ben Pfaff [Tue, 30 Dec 2008 00:17:09 +0000 (16:17 -0800)]
 
vswitchd: Fix SIGHUP behavior for bonded ports.
Ben Pfaff [Tue, 30 Dec 2008 00:01:46 +0000 (16:01 -0800)]
 
vswitchd: Properly renumber port_ifidx values on iface destruction.
Ben Pfaff [Tue, 30 Dec 2008 00:01:16 +0000 (16:01 -0800)]
 
vswitchd: Revalidate all flows upon bridge configuration change.
Otherwise, now-invalid flows can linger, causing trouble.
Ben Pfaff [Mon, 29 Dec 2008 23:55:54 +0000 (15:55 -0800)]
 
New function mac_learning_flush().
Ben Pfaff [Mon, 29 Dec 2008 22:29:26 +0000 (14:29 -0800)]
 
vswitchd: Fix svec_diff().
The logic bugs here were causing bridge.c to do too much work adding and
deleting interfaces unnecessarily and perhaps in some circumstances getting
the set of interfaces wrong entirely.
Ben Pfaff [Mon, 29 Dec 2008 23:59:48 +0000 (15:59 -0800)]
 
vswitchd: Comment out annoying bonding-related logging, for now.
Ben Pfaff [Mon, 29 Dec 2008 21:30:48 +0000 (13:30 -0800)]
 
vswitchd: Fix svec memory leaks.
Pointed out by Justin.
Ben Pfaff [Mon, 29 Dec 2008 21:26:19 +0000 (13:26 -0800)]
 
Make ds_cstr() always null-terminate the string.
Most of the time the string in "struct ds" is
null-terminated, but there seem to be a few corner cases
where it is not.  Make ds_cstr() always put in the null
terminator, for safety.
Thanks to Justin for pointing out the problem.
Ben Pfaff [Mon, 29 Dec 2008 21:07:09 +0000 (13:07 -0800)]
 
vswitchd: Implement bonding link failure detection & failover.
Ben Pfaff [Mon, 29 Dec 2008 21:06:56 +0000 (13:06 -0800)]
 
New functions port_array_destroy(), port_array_clear().
Ben Pfaff [Sun, 28 Dec 2008 06:45:25 +0000 (22:45 -0800)]
 
Document vswitchd.
Ben Pfaff [Sat, 27 Dec 2008 23:36:49 +0000 (15:36 -0800)]
 
Factor out common parts of manpages.
There was a lot of duplication in the sources for the
manpages, because many of the programs have common options.
This factors out some of the duplication into include
files, using the man ".so" directive.  It also uses the
".ds" directive to define strings that should be
customized for each program's manpage.
Ben Pfaff [Sat, 27 Dec 2008 05:26:46 +0000 (21:26 -0800)]
 
vswitchd: Actually tag flows that go out bonded devices.
The change that introduced rebalancing for bonded devices
set up the infrastructure for revalidating flows that go
out bonded devices, but neglected to actually tag those
flows.  This fixes the problem.
Ben Pfaff [Sat, 27 Dec 2008 00:47:35 +0000 (16:47 -0800)]
 
vswitchd: Basic bonding rebalancing works.
So far only tested with hping3.  At least, need to make sure that existing
flows get redirected through the new interface as well.
Ben Pfaff [Sat, 27 Dec 2008 00:48:27 +0000 (16:48 -0800)]
 
vswitchd: Work on flow statistics gathering.
Ben Pfaff [Wed, 24 Dec 2008 23:09:41 +0000 (15:09 -0800)]
 
vswitchd: Implement stats request manager.
Ben Pfaff [Wed, 24 Dec 2008 23:11:17 +0000 (15:11 -0800)]
 
Make tag_set_add() avoid adding tags that are already present.
Ben Pfaff [Wed, 24 Dec 2008 23:10:48 +0000 (15:10 -0800)]
 
New functions for iterating through flow stats replies.
Ben Pfaff [Wed, 24 Dec 2008 23:09:57 +0000 (15:09 -0800)]
 
New function ofpbuf_clone_data().
Ben Pfaff [Fri, 26 Dec 2008 19:06:09 +0000 (11:06 -0800)]
 
vswitchd: Fix treatment of unbuffered packets.
Before, buggy code caused unbuffered packets to be dropped.  This fixes
the problem.
Ben Pfaff [Fri, 26 Dec 2008 19:04:15 +0000 (11:04 -0800)]
 
Drop message about short Ethernet frames entirely.
It's just not useful.
Ben Pfaff [Wed, 24 Dec 2008 19:01:37 +0000 (11:01 -0800)]
 
vswitchd: Automatically restart secchan if it dies.
Ben Pfaff [Wed, 24 Dec 2008 01:06:17 +0000 (17:06 -0800)]
 
Implement revalidation.
Ben Pfaff [Wed, 24 Dec 2008 00:57:23 +0000 (16:57 -0800)]
 
Add support for tags to mac-learning library, and update client code.
Ben Pfaff [Wed, 24 Dec 2008 00:57:58 +0000 (16:57 -0800)]
 
Implement generic tag library.
Ben Pfaff [Wed, 24 Dec 2008 01:02:46 +0000 (17:02 -0800)]
 
New functions random_uint8(), random_uint16().
Also, reimplement random_uint32() to make fewer calls to rand().
Ben Pfaff [Wed, 24 Dec 2008 01:02:54 +0000 (17:02 -0800)]
 
New macro IS_POW2().
Ben Pfaff [Tue, 23 Dec 2008 22:59:48 +0000 (14:59 -0800)]
 
Implement generic hash table.
Ben Pfaff [Tue, 23 Dec 2008 23:05:45 +0000 (15:05 -0800)]
 
New function flow_equal().
Ben Pfaff [Tue, 23 Dec 2008 23:04:54 +0000 (15:04 -0800)]
 
Inline flow_compare() and flow_hash(), for performance.
Ben Pfaff [Tue, 23 Dec 2008 23:03:37 +0000 (15:03 -0800)]
 
Make flow_hash() use hash_lookup3(), for speed and hash quality.
Ben Pfaff [Tue, 23 Dec 2008 23:01:25 +0000 (15:01 -0800)]
 
Add faster and better-quality hash function hash_lookup3().
Ben Pfaff [Mon, 22 Dec 2008 06:19:17 +0000 (22:19 -0800)]
 
Remove misplaced comment.
Ben Pfaff [Sat, 20 Dec 2008 00:33:31 +0000 (16:33 -0800)]
 
vswitch: Implement basic bonding.
Rebalancing and link failure detection are missing, but the basics are
there (and work OK in simple testing).
Ben Pfaff [Fri, 19 Dec 2008 23:10:18 +0000 (15:10 -0800)]
 
vswitch: Pass --monitor to secchan processes, to allow monitoring them.
Justin Pettit [Sat, 20 Dec 2008 00:06:11 +0000 (16:06 -0800)]
 
Add #include <limits.h> to fix build problem with undefined "_POSIX_PIPE_BUF".
Ben Pfaff [Thu, 18 Dec 2008 22:26:29 +0000 (14:26 -0800)]
 
vswitchd: Fix stupid thinko.
Ben Pfaff [Thu, 18 Dec 2008 22:00:59 +0000 (14:00 -0800)]
 
vswitchd: Basic working VLAN support.
Ben Pfaff [Thu, 18 Dec 2008 22:01:35 +0000 (14:01 -0800)]
 
New functions put_openflow() and put_openflow_xid().
Ben Pfaff [Thu, 18 Dec 2008 22:00:23 +0000 (14:00 -0800)]
 
Add support for VLAN tags to the MAC learning library.
vswitchd needs to keep separate per-VLAN MAC learning tables, so this adds
a VLAN tag to each MAC learning table entry.  The existing users of the
MAC learning table don't care about VLANs, so they always pass in a VLAN
of 0.
There is a very good chance that vswitchd will need additional features in
its MAC learning table that don't fit well into the existing library.  In
that case this commit will probably be reverted and a separate MAC learning
implementation added in the vswitch directory.
Ben Pfaff [Thu, 18 Dec 2008 20:43:57 +0000 (12:43 -0800)]
 
cfg: Fix functions for retrieving keys.
They didn't work.  At all.
Ben Pfaff [Wed, 17 Dec 2008 01:19:09 +0000 (17:19 -0800)]
 
Initial, skeletal implementation of vswitchd.
Ben Pfaff [Wed, 17 Dec 2008 00:39:20 +0000 (16:39 -0800)]
 
New function ds_get_line().
Ben Pfaff [Wed, 17 Dec 2008 00:39:01 +0000 (16:39 -0800)]
 
New function ds_put_buffer().
Ben Pfaff [Wed, 17 Dec 2008 00:38:01 +0000 (16:38 -0800)]
 
New functions for verify OpenFlow message types and lengths.
Ben Pfaff [Wed, 17 Dec 2008 00:36:25 +0000 (16:36 -0800)]
 
New function ofp_message_type_to_string().
Ben Pfaff [Wed, 17 Dec 2008 00:28:50 +0000 (16:28 -0800)]
 
Make secchan exit if the connection drops and can never be reconnected.
In particular this happens if the controller is specified using a fd vconn,
since once disconnected a fd vconn can never be reconnected.
This behavior is useful for vswitchd, which connects to secchan over a
fd vconn.
Ben Pfaff [Wed, 17 Dec 2008 00:57:40 +0000 (16:57 -0800)]
 
Add new "fd" vconn, which takes a file descriptor number as argument.
This requires introducing the concept of a "reconnectable" vconn.  A vconn
is reconnectable if, when it is closed, it is possible to try to reconnect
to it using the name that was originally used.  This is the case for all
existing vconn types, but it is not true for fd vconns, because closing a
fd vconn closes the specified file descriptor, and thus attempting to
reopen it will get an EBADF error.
An rconn is not reliable if it is connected to a vconn that is not
reconnectable.
Ben Pfaff [Wed, 17 Dec 2008 00:19:36 +0000 (16:19 -0800)]
 
Introduce x2nrealloc() helper function, and use it.
Also fixes a bug in read_cert_file() in vconn-ssl.c: "sizeof *certs"
should have been "sizeof **certs".  In fact the sizes will be identical
in all practical cases since both *certs and **certs are pointer types,
so this is not an important fix.
Ben Pfaff [Wed, 17 Dec 2008 00:13:36 +0000 (16:13 -0800)]
 
Make datapath interface library more flexible.
A single netlink socket can address any kernel datapath, but the datapath
interface library was artificially restricting a dpif to address a single
datapath that was selected at dpif creation time.  This commit removes
that restriction.
This is useful for vswitchd, which can create and destroy any number of
datapaths and add and remove ports on them.  It's more convenient to use
a single dpif for that instead of many.
Ben Pfaff [Wed, 17 Dec 2008 00:10:31 +0000 (16:10 -0800)]
 
Move DP_MAX into public header file.
vswitchd wants to know the maximum number of datapaths, so DP_MAX needs to
be exported.
(This is not an ideal situation.  Really the kernel should not have an
explicit limit on the number of datapaths, and userspace should be able
to query the current maximum.)
Ben Pfaff [Wed, 17 Dec 2008 00:35:56 +0000 (16:35 -0800)]
 
Improve formatting of process termination messages in secchan logging.
My expectation was that strsignal() returns the signal's name, e.g.
SIGTERM.  It actually returns an English explanation, so that the existing
code would log a message like "terminated by signal Terminated".  This
commit changes the message to the more sensible "terminated by signal 15
(Terminated)".
Also, the recently approved POSIX 2008 standardized strsignal() and in
particular says that it may return NULL for unknown signal numbers, so
this commit fixes the behavior on NULL return.
Ben Pfaff [Wed, 17 Dec 2008 00:32:27 +0000 (16:32 -0800)]
 
vlog: Optimize logging disabled, rate-limited messages.
Previously the arguments of rate-limited messages were always evaluated
and passed to vlog_rate_limit().  This commit short-circuits the case
where the vlog levels would prevent any messages from being logged even
without considering rate limiting.
Ben Pfaff [Wed, 17 Dec 2008 00:29:36 +0000 (16:29 -0800)]
 
Reduce rate limit for short-packet messages even further.
These messages appear a lot in a virtualized environment, and they really
are not meaningful there.
Ben Pfaff [Wed, 17 Dec 2008 00:30:19 +0000 (16:30 -0800)]
 
Fix typo in comment.
Ben Pfaff [Wed, 17 Dec 2008 00:07:41 +0000 (16:07 -0800)]
 
Add reminder comment to lib/learning-switch.c.
(This doesn't change the semantics of the code at all.)
Ben Pfaff [Fri, 12 Dec 2008 22:56:57 +0000 (14:56 -0800)]
 
Fix mangled header guards in ofp-print.h.
Ben Pfaff [Fri, 12 Dec 2008 01:14:18 +0000 (17:14 -0800)]
 
Improve secchan.8 manpage.
Ben Pfaff [Fri, 12 Dec 2008 01:00:43 +0000 (17:00 -0800)]
 
Fix typo in error message.
Ben Pfaff [Fri, 12 Dec 2008 00:41:25 +0000 (16:41 -0800)]
 
Style fix: f(x) is better than f((x))
Ben Pfaff [Thu, 11 Dec 2008 22:07:08 +0000 (14:07 -0800)]
 
Add userspace datapath to openflow.
Ben Pfaff [Thu, 11 Dec 2008 22:06:34 +0000 (14:06 -0800)]
 
Update required Autoconf version in INSTALL.
The AC_PREREQ was updated some time ago but the documentation lagged
behind.
Ben Pfaff [Thu, 11 Dec 2008 17:35:24 +0000 (09:35 -0800)]
 
Make ds_put_char_multiple() use the provided character instead of a space.
Fortunately this function was only used for formatting log messages, in
a context where spaces were the normal padding character.
Found by Chris Eagle.
Justin Pettit [Wed, 3 Dec 2008 07:55:12 +0000 (23:55 -0800)]
 
Cleanup some formatting in openflow.h.
Justin Pettit [Wed, 3 Dec 2008 06:17:36 +0000 (22:17 -0800)]
 
Change references in comments from "ofp_vendor" to "ofp_vendor_header".
Ben Pfaff [Tue, 2 Dec 2008 16:27:31 +0000 (08:27 -0800)]
 
Update prerequisite Autoconf version to 2.60 (from 2.59).
We use the MKDIR_P variable that only Autoconf 2.60 and
later supports, but we were only requiring Autoconf 2.59
or later.  This fixes the problem.
Also, we were not explicitly invoking AC_PROG_MKDIR_P from
configure.ac, even though we were using $(MKDIR_P).  Some
other macro must have been internally invoking
AC_PROG_MKDIR_P, but it's not good to depend on that, so
this commit adds an explicit call to it.
Justin Pettit [Tue, 2 Dec 2008 06:23:14 +0000 (22:23 -0800)]
 
Fix compatibility back to Linux 2.6.15 and 2.4.32.
Ben Pfaff [Tue, 2 Dec 2008 05:26:57 +0000 (21:26 -0800)]
 
Add missing "%s" to VLOG_WARN_RL call.
Thanks to Justin for pointing out the problem.
Justin Pettit [Tue, 2 Dec 2008 05:08:43 +0000 (21:08 -0800)]
 
Officially call this code version 0.8.9~1.
Justin Pettit [Mon, 1 Dec 2008 22:34:23 +0000 (14:34 -0800)]
 
Add support for listing and deleting entries based on an output port.
To support this, an "out_port" field has been added to the "ofp_flow_mod",
"ofp_flow_stats_request", and "ofp_aggregate_stats_request" messages.  If an
"out_port" contains a value other than "OFPP_NONE", it introduces a constraint
when matching.  This constraint is that the rule must contain an output action
directed at that port.  Other constraints such as ofp_match structs and
priorities are still used; this is purely an *additional* constraint.  Note
that to get previous behavior, though, "out_port" must be set to "OFPP_NONE",
since "0" is a valid port id.  This only applies to the delete and
delete_strict flow mod commands; the field is ignored by add, modify, and
modify_strict.
Ben Pfaff [Wed, 26 Nov 2008 19:38:28 +0000 (11:38 -0800)]
 
Add DATAPATH_ID to switch packaging, to enable persistent DPIDs.
Ben Pfaff [Wed, 26 Nov 2008 19:27:06 +0000 (11:27 -0800)]
 
Allow the datapath ID to be configured by changing the ofX MAC address.
Previously, you could change the MAC address but that had no effect on
the datapath ID, so that there was no way to change the datapath ID at all.
Ben Pfaff [Thu, 27 Nov 2008 00:18:16 +0000 (16:18 -0800)]
 
Simplify code in stream_recv().
There is no need to test whether retval is nonzero at this point in the
code: we already know that it is negative from the two previous "if"
branches.
Ben Pfaff [Thu, 27 Nov 2008 00:07:56 +0000 (16:07 -0800)]
 
Make dpif_close() accept a null pointer.
It's customary for destructor functions to accept and ignore null pointers.
This commit does not fix any known bug.
Ben Pfaff [Thu, 27 Nov 2008 00:27:21 +0000 (16:27 -0800)]
 
rconn_destroy() should close monitoring connections, to avoid a leak.
Our current code base never closes an rconn that has a monitoring
connection, so this does not fix any larger problem.