Lab3¶
在本次实验中,我们将学习简单的 socket 编程,分别利用多线程技术、IO 复用技术、或是 async/await 协程编写一个简单的多人聊天室程序。
首先给出一个简单的双人聊天室示例程序:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <pthread.h>
struct Pipe {
int fd_send;
int fd_recv;
};
void *handle_chat(void *data) {
struct Pipe *pipe = (struct Pipe *)data;
char buffer[1024] = "Message: ";
ssize_t len;
while ((len = recv(pipe->fd_send, buffer + 9, 1000, 0)) > 0) {
send(pipe->fd_recv, buffer, len + 9, 0);
}
return NULL;
}
int main(int argc, char **argv) {
int port = atoi(argv[1]);
int fd;
if ((fd = socket(AF_INET, SOCK_STREAM, 0)) == 0) {
perror("socket");
return 1;
}
struct sockaddr_in addr;
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = INADDR_ANY;
addr.sin_port = htons(port);
socklen_t addr_len = sizeof(addr);
if (bind(fd, (struct sockaddr *)&addr, sizeof(addr))) {
perror("bind");
return 1;
}
if (listen(fd, 2)) {
perror("listen");
return 1;
}
int fd1 = accept(fd, NULL, NULL);
int fd2 = accept(fd, NULL, NULL);
if (fd1 == -1 || fd2 == -1) {
perror("accept");
return 1;
}
pthread_t thread1, thread2;
struct Pipe pipe1;
struct Pipe pipe2;
pipe1.fd_send = fd1;
pipe1.fd_recv = fd2;
pipe2.fd_send = fd2;
pipe2.fd_recv = fd1;
pthread_create(&thread1, NULL, handle_chat, (void *)&pipe1);
pthread_create(&thread2, NULL, handle_chat, (void *)&pipe2);
pthread_join(thread1, NULL);
pthread_join(thread2, NULL);
return 0;
}
使用如下命令编译并运行:
gcc 1.c -o 1 -lpthread
./1 6666
接着两个终端中分别使用如下命令连接:
nc 127.0.0.1 6666
其中 nc
是 netcat
包内的一个程序
这样从一个终端输入的消息,会转发到另一个终端,于是便实现了两个客户端间的聊天。这个聊天室程序十分简陋,忽略了 socket 编程中的很多细节,你的任务就是修改它(或者从头编写),使得它更健壮,并且支持多人聊天。
双人聊天室 2'+2'¶
实现以换行为分隔符的消息分割 2'¶
TCP 是一个基于流的协议,本身没有“消息”的概念。在整个连接中,客户端发送的数据只是一连串的字节,服务端并不知道应怎样分割这些数据。示例程序将一次 recv
得到的数据视为一个消息,是不合适的(一次 send
并不一定对应对方的一次 recv
)。请重新实现接收数据的部分,以换行符 \n
为分隔符接收和分割数据,并以一条消息为单位发送给另一个客户端。在助教的测试中消息的长度不超过 1 MiB(1,048,576 字节)。
例如,你向服务器发送了 Hi.\nIt's Cindy here.
,在其他连接到服务器的 nc 双人聊天室客户端中会收到这样的消息:
Message: Hi.
Message: It's Cindy here.
而不是收到一个带有换行符的消息:
Message: Hi.
It's Cindy here.
你可能已经发现在 nc 中每次按下回车都会导致消息发送,要如何发送带有换行符的消息呢?这里可以使用 lab2 中提到的管道和文件重定向:
echo -e "Hi.\nIt's Cindy here" | nc 127.0.0.1 6666
也可以将你要发送的内容写到文件里,然后通过 >
重定向输入。
需要注意的是,你可以对每个收到的字符进行匹配,但是每次调用 recv
只接收一个字符是非常低效的(带来了不必要的 syscall 开销)。你的实现应当能够一次接收大量数据,并能够以 \n
对消息进行分割。如果你不知道如何实现,最终还是每次只接收一个字符,你只能得到一半的分数(1')。
处理 send
无法一次发送所有数据的情况 2'¶
当发送的数据长度足够大时,可能无法一次将所有数据发送完毕。此时 recv
与 send
都可能只收发了部分数据,请处理这种情况,使得长度较大的数据能被完整地发送到客户端。多次发送产生的额外 Message:
信息可以不处理。
提示
可以查阅 send
与 recv
的文档,了解返回值的含义。
测试时可以通过 I/O 重定向来向聊天室一方输入一个大文件(>1MB),若成功接收则另一方得到的文件应该是相同的。
基于多线程的多人聊天室 4'+2'¶
简单的多线程聊天室 4'¶
接下来,我们将实现一个支持多人在线的聊天室,具体要求如下:
- 最多支持 32 个用户同时在线,用户可以随时加入与退出
- 程序将用户发出的数据以换行符分割为消息,并将消息完整地发送给其他用户
你需要使用阻塞 IO 与多线程技术来实现上述需求。可以使用的线程库有 pthread, Windows API 或 std::thread
。除了标准库与上述库,请勿使用其他库。在测试中消息的长度不超过 1 MiB。
请注意,socket 是全双工的,即可以由两个线程同时分别读取与写入。但并发地读取或并发地写入可能会造成意想不到的后果。请利用操作系统课程中线程同步的相关知识实现对 socket 的安全操作。
pthread
如果你在类 Unix 系统下编程,可以选择使用 pthread 线程库,这里将对其基本用法做出介绍。
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
int pthread_join(pthread_t thread, void **retval);
int pthread_detach(pthread_t thread);
pthread_create
函数用于创建并启动一个新的进程。第一个参数为指向我们要创建的线程对象的指针;第二个参数为创建时的属性,目前可以忽略;第三个参数为线程启动后将要执行的函数指针;第四个参数为传入线程执行函数的数据。
pthread_join
用于等待线程的结束,并接收返回值。第一个参数为线程对象,第二个参数为接收返回值的变量的指针,如果为 NULL
表示忽略返回值。
pthread_detach
可以将线程与主线程分离,使该线程运行结束后得以终止自己并释放资源。分离后的线程将不能被 pthread_join
等待。
另外 pthread 线程库还包含处理互斥锁的函数。
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);
int pthread_mutex_destroy(pthread_mutex_t *mutex);
int pthread_mutex_lock(pthread_mutex_t *mutex);
int pthread_mutex_unlock(pthread_mutex_t *mutex);
正如函数名所示,这四个函数分别对应了互斥锁的初始化、销毁、加锁和解锁。你也可以直接使用 PTHREAD_MUTEX_INITIALIZER
宏来初始化互斥锁。
pthread 也包含处理条件变量的函数,可用于阻塞和同步线程。
int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);
int pthread_cond_destroy(pthread_cond_t *cond);
int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
下面的代码展示了条件变量和互斥锁简单的使用方法:
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
pthread_cond_t cv = PTHREAD_COND_INITIALIZER;
int ready = 0;
int data;
void *worker(void *p) {
pthread_mutex_lock(&mutex);
while (!ready) {
pthread_cond_wait(&cv, &mutex);
}
printf("%d\n", data);
pthread_mutex_unlock(&mutex);
return NULL;
}
int main() {
pthread_t thread;
pthread_create(&thread, NULL, worker, NULL);
pthread_mutex_lock(&mutex);
sleep(1);
data = 1234;
ready = 1;
pthread_cond_signal(&cv);
pthread_mutex_unlock(&mutex);
pthread_join(thread, NULL);
return 0;
}
以上就是 pthread 线程库最基本的用法,如需进一步学习更高级的特性,请自行在互联网上搜索教程与文档。
C++ 线程库
如果你比较熟悉 C++ ,也可以使用 C++ 标准库中的线程库。这里给出一个与上面的示例程序功能相同的例子:
#include <iostream>
#include <thread>
#include <mutex>
#include <condition_variable>
#include <chrono>
int main() {
int n = 0;
int data;
bool ready = false;
std::mutex mutex;
std::condition_variable cv;
auto f = [&] {
std::unique_lock<std::mutex> lock(mutex);
cv.wait(lock, [&]{return ready;});
std::cout << data << std::endl;
};
std::thread thread(f);
std::this_thread::sleep_for(std::chrono::seconds(1));
{
std::lock_guard<std::mutex> lock(mutex);
data = 1234;
ready = true;
cv.notify_one();
}
thread.join();
return 0;
}
请自行参阅 C++ 手册学习线程库的用法。
细粒度锁 2'¶
如果你直接实现了这一部分,可以在得到附加分的同时一并获得前面的 4 分。
在上面的实现中你很可能直接对 read/write 操作进行了加锁,但对阻塞操作进行加锁容易引发问题(如因为一个阻塞操作不成功而导致锁无法释放),同时锁的引入本身会对性能造成影响。为了尽可能减小锁对系统性能带来的影响,你应当尽量减小锁的占用时长。
请实现一个细粒度锁以规避上述情况。
提示
对 read/write 操作加锁是为了避免对同一个 fd 同时进行多个读/写操作。试想一种架构,它能够保证对同一个 fd 的多个读/写操作不会同时进行。 可以考虑用消息队列作为通信方式,而不是直接向接收方的 fd 发送消息。
基于 IO 复用/异步 IO 的多人聊天室 4'+1'+1'+2'¶
除了多线程,IO 复用与异步 IO 技术也是实现并发服务器的常见方式。在示例程序中,我们可以发现 recv
大部分时间都在等待数据的到来,实际上处于空闲状态。因此在这种情况下,多线程实际上是没有必要的,我们可以使用非阻塞 IO 与 IO 复用技术实现相同的功能。常见的 IO 复用实现有:SELECT
、EPOLL
,异步实现有 async/await 与 io_uring
。
SELECT 4'¶
这里使用 Unix 标准中用于 IO 多路复用的系统调用 select
实现了与第一个示例程序相同的功能:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/socket.h>
#include <sys/select.h>
#include <sys/time.h>
#include <netinet/in.h>
struct Pipe {
int fd_send;
int fd_recv;
};
int main(int argc, char **argv) {
int port = atoi(argv[1]);
int fd;
if ((fd = socket(AF_INET, SOCK_STREAM, 0)) == 0) {
perror("socket");
return 1;
}
struct sockaddr_in addr;
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = INADDR_ANY;
addr.sin_port = htons(port);
socklen_t addr_len = sizeof(addr);
if (bind(fd, (struct sockaddr *)&addr, sizeof(addr))) {
perror("bind");
return 1;
}
if (listen(fd, 2)) {
perror("listen");
return 1;
}
int fd1 = accept(fd, NULL, NULL);
int fd2 = accept(fd, NULL, NULL);
if (fd1 == -1 || fd2 == -1) {
perror("accept");
return 1;
}
fd_set clients;
char buffer[1024] = "Message:";
fcntl(fd1, F_SETFL, fcntl(fd1, F_GETFL, 0) | O_NONBLOCK); // 将客户端的套接字设置成非阻塞
fcntl(fd2, F_SETFL, fcntl(fd2, F_GETFL, 0) | O_NONBLOCK);
while (1) {
FD_ZERO(&clients);
FD_SET(fd1, &clients);
FD_SET(fd2, &clients);
if (select(fd2 + 1, &clients, NULL, NULL, NULL) > 0) { // 找出可以读的套接字
if (FD_ISSET(fd1, &clients)) {
ssize_t len = recv(fd1, buffer + 8, 1000, 0);
if (len <= 0) {
break;
}
send(fd2, buffer, len + 8, 0);
}
if (FD_ISSET(fd2, &clients)) {
ssize_t len = recv(fd2, buffer + 8, 1000, 0);
if (len <= 0) {
break;
}
send(fd1, buffer, len + 8, 0);
}
} else {
break;
}
}
return 0;
}
对于一般的阻塞的 socket ,进行 recv
操作时如果缓冲区中无数据可读,将会阻塞直到有数据为止,这样使得大量时间用于等待数据上。而对于非阻塞的 socket ,若无数据可读 recv
将直接返回,而不会阻塞住。再配合 select
,每次找出可读的文件描述符,就可以实现在一个线程中同时处理多个连接。select
系统调用还可以找出可写及出错的文件描述符,并设定等待检查完成的最长时间。你可以在互联网上查找更多关于 select
的资料。
除了所有 Unix 系统都有的 select
系统调用,Linux 的 epoll
,FreeBSD 和 macOS 的 kqueue
,以及 Windows 的 IOCP
也能实现类似的功能,并且相比 select
都有很高的效率。这几种 IO 复用 / 异步 IO 接口有各自的语义与用法,你可以选择任意一种,并以此为基础实现一个多人聊天室。你可能需要学习一些非阻塞 IO 网络编程的基础知识,比如 Reactor 设计模式。
聊天室的要求与多线程版本的相同,但你不得使用多线程技术。除了标准库与所使用系统的库外,请勿使用任何第三方的网络库或事件处理库。
EPOLL* 1'¶
如果你实现了 EPOLL 的版本,可以在拿到附加分的同时一并拿到 SELECT 的 4 分
和 SELECT
相比,EPOLL
的效率要更高,并且还有很多方便的功能,是更为现代的实现(不过仅限于 Linux)。请通过 EPOLL 实现上述功能。相关文档可以参考互联网。
async/await* 1'¶
由于 C 是一种比较古老的语言,而 C++ 的 coroutine 支持在 C++20 才加入且不够完全,我们建议在实现此部分内容时使用 Rust 完成,但如果你愿意挑战 C/C++ 下的协程编程也是可行的。
仅在此章节中,我们允许使用热门的 Rust 异步编程库,例如 tokio
和 async-std
。 如果你想使用其他的异步库亦可提前询问我们。
关于协程是什么可以参见这篇文章:https://www.baeldung.com/java-threading-models 。 async/await 的具体使用方法可以参见 tokio
的文档 https://docs.rs/tokio/1.6.1/tokio/ 。
async/await 可以如下理解:
async fn f()
将一个函数声明为了一个特殊的函数,进行 f()
调用时不会执行函数内容,而是返回一个 coroutine 对象,例如可以 let a = f()
;对这个对象执行 a.await
会在运行到此处时实际运行函数内容,但同时会定义一个 breakpoint,线程到达这里时,可以继续执行 a.await
的函数内容,也可以去执行其他的 .await
点位。比喻性的说,协程是代码控制(而不是 OS 调度控制)的线程,代码可以实际规定一部分协程的运行顺序。因此,协程可以与线程不一一对应,这些协程应该由多少线程执行、应该先执行哪些协程是由最外层的 runner,或者说 runtime 决定的。
一个简单的 Rust async/await 协程例子可以参考 https://github.com/myl7/dnsl ,这是一个基于 async/await 实现的 DNS 中继器。
在足够现代的编程语言几乎都有 async/await 的实现,包括:
- Python,从 3.5 开始正式叫 async/await
- Javascript,Promise,从 ECMAScript 2017 开始标准化
- Rust,Future trait,从 1.39.0 开始
- Kotlin,structured coroutine,主打点之一/对比 Java 的优势之一
在本部分中,你需要将自己实现的客户端改写为用 async/await 实现。 一般来说,只要你的几个工作函数是 async fn
即可。 如果你不确定自己的实现是否“足够 async/await”,请积极询问助教们。
io_uring* 2'¶
io_uring
是最近才被引入内核的高效异步实现。和上面的几种方法相比使用 io_uring
能够带来显著的性能提升。不过由于本身是较新的概念,助教也没有完成示例代码。一些供参考的资料:一篇文章带你读懂 io_uring 的接口与实现 epoll 与 io_uring 服务器编程实践及对比 以及 liburing
库,它封装了 io_uring
的 syscall,你很可能会用到。一些基于它实现的例子:io_uring bare minimum echo server、liburing Examples。
如果你实现了这一部分,除了分数你还可以赢得助教的掌声。
实验要求与截止日期¶
请按照以下目录结构组织你的 GitHub 仓库:
(Git) // Git 仓库目录
├── lab3 // 实验三根目录
│ ├── 1.c // 完善后的双人聊天室的源代码
│ ├── 2.c // 基于多线程的多人聊天室的源代码
│ ├── 3.c // 基于 IO 复用的多人聊天室的源代码
│ ├── 4.c // 基于协程的多人聊天室的源代码
│ ├── 5.c // 基于 io_uring 的多人聊天室的源代码
│ ├── Makefile // (可选)你提供的 Makefile
│ └── README.md // 实验报告
├── .gitignore
└── README.md
如果你的目录结构与上述不同,在 README 中说明即可。
本次实验满分为 14 分,可获得的分数为 18 分,每个实现的分数都已经标在了标题后,其中一部分的进阶实现包含了对应的普通实现的分数(在文档中已另行标注)。助教在认为比较有难度的实现后加注了*标。你只需要从以上项目中任选几项完成,超过 14 分的部分可以填补本实验其他项目的扣分,你可以多拿一些分数来让结果更稳一点,但总分不会超过 14。
性能不是本实验关注的重点,只需要正确实现功能即可。与实验二相似,本实验不要求实验报告,但是推荐简单描述你的实现,以使助教能更好地理解你的代码,以免造成误解。
本实验截止日期为 6 月 2 日晚 23:59
其他说明¶
本实验可以使用 C/C++/Rust 语言完成,如果需要使用其他语言请先询问助教。
本实验可以使用 C/C++ 的标准库,也可以使用操作系统的库(如 POSIX 标准库或 Windows API),但除了 await/async 部分外其他部分不得使用任何第三方的网络库或事件处理库。使用此处没有列出的库前请询问助教。