电子头条

Linux多线程编程

2020-10-12
    阅读数:


1、线程与多线程的定义

线程存在于进程当中,是操作系统调度执行的最小单位。说通俗点线程就是干活,多线程也就是同时可以干不同的活而且还不会互相打扰,线程并没有自己的独立空间。

2、进程与线程的区别与联系

如果说进程是一个资源管家,负责从主人那里要资源的话,那么线程就是干活的苦力。一个管家必须完成一项工作,就需要最少一个苦力,也就是说,一个进程最少包含一个线程,也可以包含多个线程。苦力要干活,就需要依托于管家,所以说一个线程,必须属于某一个进程。进程有自己的地址空间,线程使用进程的地址空间,也就是说,进程里的资源,线程都是有权访问的,比如说堆啊,栈啊,静态存储区什么的。

线程就是个无产阶级,但无产阶级干活,总得有自己的劳动工具吧,这个劳动工具就是栈,线程有自己的栈,这个栈仍然是使用进程的地址空间,只是这块空间被线程标记为了栈。每个线程都会有自己私有的栈,这个栈是不可以被其他线程所访问的。

从上面我们知道了进程和线程区别,使用多线程首先是要和进程相对比,它是一种非常便捷的多任务操作方式;我们知道,在Linux系统下,启动一个新的进程必须分配给它独立的地址空间,建立众多的数据表来维护它的代码段、堆栈段和数据段,这是一种"昂贵"的多任务工作方式。而运行于一个进程中的多个线程,它们彼此之间使用相同的地址空间,共享大部分数据,启动一个线程所花费的空间远远小于启动一个进程所花费的空间,而且,线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。据统计,总的说来,一个进程的开销大约是一个线程开销的30倍左右,当然,在具体的系统上,这个数据可能会有较大的区别。对不同进程来说,它们具有独立的数据空间,要进行数据的传递只能通过通信的方式进行,这种方式不仅费时,而且很不方便。线程则不然,由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其它线程所用,这不仅快捷,而且方便。当然,数据的共享也带来其他一些问题,有的变量不能同时被两个线程所修改,有的子程序中声明为static的数据更有可能给多线程程序带来灾难性的打击,这些正是编写多线程程序时最需要注意的地方。

线程操作相关的函数:

2.1、线程创建函数

int pthread_create(pthread_t *tid, const pthread_attr_t *attr, void *(*func) (void *), void *arg);

参数说明:

pthread_create用于创建一个线程,成功返回0,否则返回Exxx(为正数)。

pthread_t tid:线程id的类型为pthread_t,通常为无符号整型,当调用pthread_create成功时,通过 tid指针返回。

const pthread_attr_t *attr:指定创建线程的属性,如线程优先级、初始栈大小、是否为守护进程等。可以使用NULL来使用默认值,通常情况下我们都是使用默认值。

void *(*func) (void *):函数指针func,指定当新的线程创建之后,将执行的函数。

void *arg:线程将执行的函数的参数。如果想传递多个参数,请将它们封装在一个结构体中。

2.2、线程等待的函数

int pthread_join (pthread_t tid, void ** status);

参数说明:

pthread_join用于等待某个线程退出,成功返回0,否则返回Exxx(为正数)。

pthread_t tid:指定要等待的线程ID。

void ** status:如果不为NULL,那么线程的返回值存储在status指向的空间中(这就是为什么status是二级指针的原因!这种参数也称为“值-结果”参数)。

2.3、获得线程自身的ID的函数

pthread_t pthread_self (void);

pthread_self用于返回当前线程的ID。

2.4、线程分离的函数

int pthread_detach (pthread_t tid);

pthread_detach用于指定线程变为分离状态,就像进程脱离终端而变为后台进程类似。成功返回0,否则返回Exxx(为正数)。变为分离状态的线程,如果线程退出,它的所有资源将全部释放。而如果不是分离状态,线程必须保留它的线程ID,退出状态直到其它线程对它调用了pthread_join。

2.5、退出线程(终止线程)的函数

void pthread_exit (void *status);

pthread_exit用于终止线程,可以指定返回值,以便其他线程通过pthread_join函数获取该线程的返回值。

参数说明:

void *status:指针线程终止的返回值。

Linux内核只提供了轻量进程的支持,限制了更高效的线程模型的实现,但Linux着重优化了进程的调度开销,一定程度上弥补了这一缺陷。目前最为流行的线程机制LinuxThreads所采用的就是线程-进程“一对一”模型,调度交给核心,而在用户级实现一个包括信号处理在内的线程管理机制。

线程编程实例:pthread.c

#include 
#include 
#include 
#include 
#include 

void *thread_1(void *arg)
{
   printf("thread one\n");
}
void *thread_2(void *arg)
{
   printf("thread two\n");
}

int main()
{
    int ret = 0;
    pthread_t pid = 0;
    pthread_t pid1 = 0;
    //创建线程1
    ret = pthread_create(&pid, NULL, thread_1, NULL);
    if(ret < 0)
    {
      perror("pthread_create");
      exit(EXIT_FAILURE);
    }
    //创建线程2
    ret = pthread_create(&pid1, NULL, thread_2, NULL);
    if(ret < 0)
    {
      perror("pthread_create");
      exit(EXIT_FAILURE);
    }
    //等待线程退出
    pthread_join(pid, NULL);
    pthread_join(pid1, NULL);
    return 0;
}

注意,在gcc中,默认是不包含线程相关的库的,所以在编译这个程序操作如下是会产生错误的,如下图所示:

正确的编译方式是下面这样,要加上 -lpthread 这个库,确保编译的时候链接上。如下图所示:

运行结果:

pthread.c创建了2个线程,并在线程中实现打印功能,最终调用pthread_join等待子线程运行结束,一并退出。

通过上面的一个例程会发现一个问题,当我们去操作一个文件的时候会出现一个问题,就是不知道该听谁的,这时候我们就需要一个互斥锁,让线程一个个来,a执行完之后在执行b。

pthread2.c

#include 
#include 
#include 
#include 
#include 

//定义一个互斥锁变量
pthread_mutex_t m;
void *thread_1(void *arg)
{
    //互斥锁加锁
    pthread_mutex_lock(&m);
    printf("thread one\n");
    //互斥锁解锁
    pthread_mutex_unlock(&m);
}
void *thread_2(void *arg)
{
    pthread_mutex_lock(&m);
    printf("thread two\n");
    pthread_mutex_unlock(&m);
}

int main()
{
    int ret = 0;
    //以动态方式创建互斥锁
    ret = pthread_mutex_init(&m, NULL);
    if(ret < 0)
    {
        perror("pthread_mutex_init");
        exit(EXIT_FAILURE);
    }
    pthread_t pid = 0;
    pthread_t pid1 = 0;
    ret = pthread_create(&pid, NULL, thread_1, NULL);
    if(ret < 0)
    {
        perror("pthread_create");
        exit(EXIT_FAILURE);
    }
    ret = pthread_create(&pid1, NULL, thread_2, NULL);
    if(ret < 0)
    {
        perror("pthread_create");
        exit(EXIT_FAILURE);
    }
    pthread_join(pid, NULL);
    pthread_join(pid1, NULL);
    return 0;
}

一样的,同样执行编译加上 -lpthread 参数保证编译时链接线程库,然后运行,如下图所示:

线程安全就是多线程访问时,采用了加锁机制,当一个线程访问该函数的某个数据时,进行保护,其它线程不能进行访问直到该线程读取完成,其它线程才可以使用。不会出现数据不一致或者数据污染。






本公众号全部原创干货已整理成一个目录,点击 干货 即可获得。



后台回复 进群 」,即可加入技术交流群,进群福利: 免费赠送Linux学习资料

展开↓