8月24日14:00,十年老程序员冯耀明在CSDN Rust 学习微信交流群(见文末的二维码)分享:《用Rust实现一个典型的生产者和消费者的题目》,课程回顾请点击这里。
分享人Info:
冯耀明(博客),广州人,2005年本科毕业于浙江大学自动化控制专业,先后在华为、汇丰软件、爱立信等跨国企业从事开发工作,最近一年在创业公司为客户提供企业Web和App解决方案的设计者和开发者,目前关注服务器分布式架构领域。
更多讲师观点请看CSDN独家专访:
专访冯耀明:Rust具有C的速度且不用担心内存泄露
以下为分享实录:
《用Rust实现一个典型的生产者和消费者的题目》
今天主要通过一个例子来比较Java和Rust在实现多线程编程时的异同。
相关的代码如下:
这个题目是希望程序员能够用生产者和消费者这样的模式来解决匹配的问题。在我的Java和Rust的实现里,都是分为这么几个对象:dancetype,leader,follower,invitation。其中leader就相当于生产者,follow就相当于消费者,invitation就是中间传递的消息。整个程序的思路就是:leader通过发送invitation给follower,folower根据自己匹配的情况返回结果给leader,接受或者拒绝。
Java的实现
打开Follower.java里的这个函数
这里的Follower.this.invitations就是我们的消息队列,定义是:private LinkedList<Invitation> invitations;LinkedList不是线性安全的集合,需要我们加同步。具体的同步方法就是函数里写的,通过Java常见的用wait,notify和notifyall给对象加锁。
处理并发有wait、notify和notiyall,有兴趣的朋友可以去这里了解一下:http://www.importnew.com/16453.html。Follower就是一个等待leader发送invitation,处理并返回结果的过程。
Leader.java
这么一段代码:
里面就是Leader发送邀请inv,并等待follower返回结果的大概逻辑,通过对消息体加锁,是Java传统的实现多线程并发的方式。还有消费者的消息队列也会加锁,在Java里,有个对象叫LinkedBlockingQueue,是不用加锁就可以put和take的,但在例子里,我们选用了更简单的LinkedList,也是为了表现一下加锁的逻辑。
Rust的实现
Leader的结构为:
Follower的结构为:
对于其他语言转过来的同学,这里的Vec,i32,bool都很好理解,不过里面出现的Arc和Mutex,Sender,Receiver就是新东西了,上面这4个都是Rust标准库的东西,也是这次分享要介绍的重点对象,是这4个东西共同实现了消息的生产,传递和消费。
下面简单介绍一下分别是做什么用的:
Arc<T>实现了sync接口。Sync接口是做什么呢?权威资料是这么说的:当一个类型T实现了Sync,它向编译器表明这个类型在多线程并发时没有导致内存不安全的可能性。
如果看不懂不要紧,我们先看看实际中是怎么用的:
在这个例子里,我们关注这几句:
下面分别解释一下是做什么的:
简单的说Arc::new表明了这是通过clone()方法来使用的,每clone,都会给该对象原子计数+1,通过引用计数的方法来保证对象只要还被其中任何一个线程引用就不会被释放掉,从而保证了前面说的:这个类型在多线程并发时没有导致内存不安全的可能性。
如果我们不定义为Arc<>就传到其他线程使用,编译器会报:
error: capture of moved value: `data` data[i] += 1;
我们可以记住clone()就是Arc的用法。
接下来我们看Mutex:
Mutex实现了send接口。同样,在权威资料里是这么描述的:这个类型的所有权可以在线程间安全的转移
那我们又是怎么用Mutex的呢?就是用lock().unwrap()。lock()的作用是获取对象,如果当前有其他线程正在使用Mutex<T>里面的T对象时,本线程就会阻塞,从而保证同时只有一个线程来访问对象,mutex也另外提供了try_lock()的方法,是不阻塞的,只要其他线程被占用,就返回err,通常Arc和Mutex都是一起使用的。
回到我最原始的题目,Mutex和Arc实现了对象本身的线程共享,但是在线程间如何传递这个对象呢?就是靠channel,channel通常是这么定义的let (tx, rx) = mpsc::channel();它会返回两个对象tx和rx,就是之前我提到的sender和receiver。
在我的Rust实现里,关键的语句是以下几个:
let leaders = (0..leader_cnt).map(|i| Arc::new(Mutex::new(Leader::new(i,dance_types.len() as i32))) ).collect::<Vec<_>>();
这一句是new一堆leader出来,Arc和Mutex表明leader是可以多线程共享和访问的。
同样Follower也是:
let followers = (0..follower_cnt).map(|i| Arc::new(Mutex::new(Follower::new(i,dance_types.len() as i32,leader_cnt))) ).collect::<Vec<_>>();
接下来这几句就有点不好理解了。
这里定义了一堆的sender和receiver,其中把他们都作为leader和follower的成员变量存起来。大概意思就是每一个leader都通过sender列表可以发送invitation给所有follower,同时又有单个receiver来接受所有follower发给自己的处理结果inviresult。
同样follower也是这么做。这样在之后每一个follower和leader作为一个线程跑起来之后,都能在相互之间建立了一条通信的通道。
这个是和Java实现多线程并发最大的不同之处!Java是通过给对象加锁,Rust是通过channel转移对象的所有权,在代码里,leader发送inv给folloer是下面这一句match self.senders[*follower_id as usize].lock().unwrap().send(inv){,其中的lock().unwrap()是获得该leader对该follower的发送通道的所有权,send(inv)就是转移具体的发送对象invitation所有权了。
这个转移按照我的理解,应该是内存拷贝。就是在follower接收的时候,let inv = match self.receiver.recv() { ,原来leader里面的inv在send之后已经是不可访问了,如果你之后再次访问了inv,会报use of moved value错误,而follower里面的inv则是在follower的栈里新生成的对象,所以,在Java里面我只定义了invitation对象,但是在Rust里面,我要再定义一个InviResult,因为我即使在follower线程里面填了result字段,leader线程也不能继续访问inv了。所以需要依靠follower再次发送一个invresult给leader,所以整个Rust程序大概就是这么一个思路。
实践总结
之前我测试比较Java和Rust实现的性能时,由于没有把调试信息去掉,导致Java比Rust慢很多,特别是那些调试信息都是调用String.format,这是比几个string相加慢上10倍的方法,两者都去掉调试信息后,leader和follower都会2000的时候,在我低端外星人笔记本里,性能差别大概是2倍吧,没我想象中大,Rust的程序整个写下来比较费力,一方面是对ownership机制不熟,思维没有转变过来,另一方面Rust的确需要开发者分部分精力到语法细节上。
编者注:冯总也有一些其它的实践体会,请参见CSDN对冯耀明的专访,请戳这里。也可以查看他的个人博客里的总结。
下面摘录采访中关于Rust的内容过来:
我对Rust感受较深的是下面几点:
它跟现在动态语言是两个截然不同的方向,它适合一些资深的程序员,我倒是觉得有必要有这么一本书,叫《从C++到Rust,你需要改善的20个编程 习惯》,能从实践上告诉开发者Rust里我们应该遵从什么样的编程习惯。Rust未来是否像C那样流行开来成为新一代的主流语言没有人能够知道,但它绝对 是值得你去了解和关注的语言。
进一步的思考:反转链表 - Java和Rust的不同实现
Rust的list应该怎么定义,譬如反转列表又是怎么做呢?
《反转链表 - Java和Rust的不同实现》
由于ownership的机制和不存在空指针的情况,很多在其他带GC的语言能够跑起来的程序在Rust下面就要换一种做法。最近试用Rust的基础数据结构时,更加加强了我的看法。下面以最原始的链表list为例。
在Java中,考虑最基本的链表定义
class ListNode { int val; ListNode next; ListNode(int x) { val = x; } @Override public String toString() { StringBuilder sb = new StringBuilder(); sb.append("["); sb.append(val); ListNode pNext = this.next; while (pNext != null) { sb.append(","); sb.append(pNext.val); pNext = pNext.next; } sb.append("]"); return String.format("%s", sb.toString()); } }
如果我们要反转链表,可以这么做:
public ListNode reverseList(ListNode head) { if (head == null) { return null; } ListNode pNext = head.next; ListNode pPrevious = null; while (head != null) { pNext = head.next; head.next = pPrevious; pPrevious = head; head = pNext; } return pPrevious; }
那如果我们按照一般思维,在Rust里对应的实现就是这样子的:
struct ListNode{ id :i32, next :Option<Box<ListNode>> }
反转链表:
fn reverseList2(head :&mut Option<Box<ListNode>>) -> Option<Box<ListNode>> { match *head{ None => None, Some(head) => { let mut head = Some(head); let mut pNext = head.unwrap().next; let mut pPrevious:Option<Box<ListNode>> = None; while true { match head { None =>{break;} _ =>{} } pNext = head.unwrap().next; head.unwrap().next = pPrevious; pPrevious = head; head = pNext; } pPrevious } } }
然后编译,报了以下错误:
=》match *head{
ERROR:cannot move out of borrowed content
=》 pNext = head.unwrap().next;
ERROR:cuse of moved value: `head`
这些错误就是因为Rust的ownership机制,让我们无法像Java或者C++里保存临时变量,特别是在循环里。反复试过各种写法,都行不通。
最后,换成这么来做
链表定义:
use List::*; enum List { Cons1(i32, Box<List>), Nil, } // Methods can be attached to an enum impl List { #[inline] fn new() -> List { Nil } #[inline] fn prepend(self, elem: i32) -> List { Cons1(elem, Box::new(self)) } fn len(&self) -> i32 { match *self { Cons1(_, ref tail) => 1 + tail.len(), Nil => 0 } } fn stringify(&self) -> String { match *self { Cons1(head, ref tail) => { format!("{}, {}", head, tail.stringify()) }, Nil => { format!("Nil") }, } } } fn reverseList(list:List, acc:List ) -> List{ match list{ Cons1(val,tail) => { reverseList(*tail,acc.prepend(val)) } Nil => acc } } fn main() { let mut head = List::new(); let mut i=0; while i < 10 { i+=1; head = head.prepend(i); } println!("{:30}",head.stringify()); let result = List::new(); let result = reverseList(head,result); <span style="white-space:pre"> </span>println!("{:30}",result.stringify()); }
从结果可以看到,链表已经实现反转了。所以在Rust下面,很多做法都要换一下。有人说这就是Rust函数式编程的思维。我但愿这种递归式的做法不会有溢出。
补充:
后续 CSDN Rust 学习交流群会邀请更多的大牛来进行分享,如果你想实时听课和提问,请加群主微信 qshuguang2008 或扫描下方二维码被邀请进群,备注:实名+公司名+Rust。
编辑推荐本站 Rust 资源:
本文为CSDN原创文章,未经允许不得转载,如需转载请联系market#csdn.net(#换成@)