林子雨大数据技术原理与应用第八章课后题答案 联系客服

发布时间 : 星期五 文章林子雨大数据技术原理与应用第八章课后题答案更新完毕开始阅读69b22dbed35abe23482fb4daa58da0116c171fc8

② 用于分割单词的Bolts将接受的句子分解为独立的单词,将单词作为

Tuple的字段名发送出去;

③ 用于计数的Bolts接受表示单词的Tuple,并对其进行统计; ④ 输出每个单词以及单词出现过的次数。

33. 试述采用MapReduce框架进行单词统计,与采用Storm框架进行单词统计,

有什么区别?

MapReduce使用的是Map和Reduce的抽象,而Storm使用的是Spout和Bolts的抽象。

34. Storm 框架中的单词统计Topology定义如下,其中定义了两个Bolt,试述

两个Bolt各自

完成的功能,以及中间结果如何在两个Bolt之间传输。

第一个Bolt用于单词的分割,该Bolt中的任务随机接收Spout发送的句子,并从接收的句子中提取出单词。

第二个Bolt 接收第一个Bolt发送的Tuple进行处理,即统计分割后的单词出现的次数。

每个Bolt使用了Groupings()系列定义了Tuple 的发送方式。

35. 在Storm的单词统计实例中,为何需要使用fieldsGrouping()方法保证相同

单词发送到同一个任务上进行处理?

通过fieldsGrouping()方法,在“word”-上具有相同字段值的所有Tuple将发送到同一个任务中进行统计,从而保证了统计的准确性。