A.對(duì)分析結(jié)果進(jìn)行可視化呈現(xiàn),幫助人們更好地理解數(shù)據(jù)、分析數(shù)據(jù)
B. 利用網(wǎng)頁(yè)爬蟲程序到互聯(lián)網(wǎng)網(wǎng)站中爬取數(shù)據(jù)
C.利用ETL工具將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中
D.利用日志采集工具把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理"/>
新聞詳情
國(guó)家開放大學(xué)高起專真題《大數(shù)據(jù)技術(shù)概論》981
發(fā)表時(shí)間:2022-12-29 11:40 大數(shù)據(jù)技術(shù)概論
一 、單選題 1、 以下哪個(gè)步驟不屬于數(shù)據(jù)的采集與預(yù)處理: A.對(duì)分析結(jié)果進(jìn)行可視化呈現(xiàn),幫助人們更好地理解數(shù)據(jù)、分析數(shù)據(jù) B. 利用網(wǎng)頁(yè)爬蟲程序到互聯(lián)網(wǎng)網(wǎng)站中爬取數(shù)據(jù) C.利用ETL工具將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),抽取到臨時(shí)中間層后進(jìn)行清 洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中 D.利用日志采集工具把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理 分析 正確答案:A 2、 以下哪項(xiàng)不屬于數(shù)據(jù)清洗的內(nèi)容: A. 一致性檢查 B. 精確度校驗(yàn) C.無(wú)效值和缺失值的處理 D.成對(duì)刪除 正確答案:B 3、 以下哪項(xiàng)不屬于傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和管理技術(shù): A.NoSQL數(shù)據(jù)庫(kù) B. 文件系統(tǒng) C. 數(shù)據(jù)倉(cāng)庫(kù) D.關(guān)系數(shù)據(jù)庫(kù) 正確答案:A 4、 以下關(guān)于分布式文件系統(tǒng),描述錯(cuò)誤的是: A. 所有的分布式文件系統(tǒng)的設(shè)計(jì)都是采用“客戶機(jī)/服務(wù)器” (Client/Server) 模式 B.Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)是針對(duì) GFS的開源實(shí)現(xiàn) C. 谷歌開發(fā)了分布式文件系統(tǒng)GFS D.是一種通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)文件在多臺(tái)主機(jī)上進(jìn)行分布式存儲(chǔ)的文件系統(tǒng) 正確答案:A 5、 以下描述錯(cuò)誤的是: A. 傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)由于數(shù)據(jù)模型不靈活、水平擴(kuò)展能力較差等局限性,已經(jīng) 無(wú)法滿足各種類型的非結(jié)構(gòu)化數(shù)據(jù)的大規(guī)模存儲(chǔ)需求 B.Web 2.0的迅猛發(fā)展以及大數(shù)據(jù)時(shí)代的到來(lái),使關(guān)系數(shù)據(jù)庫(kù)的發(fā)展越來(lái)越力不 從心 C. 傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)引以為豪的一些關(guān)鍵特性,如事務(wù)機(jī)制和支持復(fù)雜查詢,在 Web 2.0時(shí)代成為不可或缺的核心特性 D.傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)可以較好地支持結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和管理 正確答案:C 6、 以下關(guān)于NoSQL數(shù)據(jù)庫(kù)描述錯(cuò)誤的是: A.NoSQL是一種不同于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng)設(shè)計(jì)方式,是對(duì)非關(guān)系型數(shù) 據(jù)庫(kù)的統(tǒng)稱 B. 與關(guān)系數(shù)據(jù)庫(kù)相比,NoSQL具有靈活的水平可擴(kuò)展性,可以支持海量數(shù)據(jù)存儲(chǔ) C.NoSQL數(shù)據(jù)庫(kù)有固定的表結(jié)構(gòu),通常存在較多連接操作 D.NoSQL所采用的數(shù)據(jù)模型并非傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的關(guān)系模型,而是類似鍵/值、 列族、文檔等非關(guān)系模型 正確答案:C 7、 下面屬于批處理技術(shù)的是: A.Spark Streaming
B. MapReduce
C.Storm D.GraphX 正確答案:B 8、 下面屬于流計(jì)算技術(shù)的是: A. S4 B. Hive C.Spark MLLib D.GraphX 正確答案:A 9、 下面屬于圖計(jì)算技術(shù)的是: A.Dremel B.Impala C.Pregel
D.DStream 正確答案:C 10、 下面屬于查詢分析計(jì)算技術(shù)的是: A.Pregel
B.Storm C.Spark Streaming
D.Hive 正確答案:D 二、 多選題 1、數(shù)據(jù)采集的三大要點(diǎn)是: A. 高效性 B.全面性 C.多維性 D. 精確性 正確答案:A、B、C 2、數(shù)據(jù)采集的主要數(shù)據(jù)源包括: A. 傳感器數(shù)據(jù) B. 企業(yè)業(yè)務(wù)系統(tǒng)數(shù)據(jù) C. 日志文件 D. 互聯(lián)網(wǎng)數(shù)據(jù) 正確答案:A、B、C、D 3、需要清洗的數(shù)據(jù)的主要類型包括: A. 殘缺數(shù)據(jù) B. 重復(fù)數(shù)據(jù) C. 錯(cuò)誤數(shù)據(jù) D. 干凈數(shù)據(jù) 正確答案:A、B、C 4、數(shù)據(jù)倉(cāng)庫(kù)的特性包括: A. 相對(duì)穩(wěn)定的 B. 面向主題的 C. 反映歷史變化的 D. 集成的 正確答案:A、B、C、D 5、NoSQL數(shù)據(jù)庫(kù)具有以下幾個(gè)特點(diǎn): A. 與云計(jì)算緊密融合 B. 靈活的可擴(kuò)展性 C. 靈活的數(shù)據(jù)模型 D. 數(shù)據(jù)模型比較死板 正確答案:A、B、C 6、典型的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法包括: A. 聚類 B. 分類 C. 正交 D. 回歸分析 正確答案:A、B、D 7、大數(shù)據(jù)處理分析技術(shù)類型主要包括: A. 查詢分析計(jì)算 B.批處理計(jì)算 C. 流計(jì)算 D. 圖計(jì)算 正確答案:A、B、C、D 8、在大數(shù)據(jù)時(shí)代,可視化技術(shù)可以支持實(shí)現(xiàn)多種不同的目標(biāo),主要包括: A. 增強(qiáng)數(shù)據(jù)吸引力 B. 觀測(cè)、跟蹤數(shù)據(jù) C. 輔助理解數(shù)據(jù) D.分析數(shù)據(jù) 正確答案:A、B、C、D 9、數(shù)據(jù)安全技術(shù)種類繁多,主要包括: A. 防火墻技術(shù) B. 可視化技術(shù) C. 訪問(wèn)控制技術(shù) D. 身份認(rèn)證技術(shù) 正確答案:A、C、D 以上就是關(guān)于國(guó)家開放大學(xué)高起專真題《大數(shù)據(jù)技術(shù)概論》,如果想要咨詢關(guān)于國(guó)家開放大學(xué)的任何問(wèn)題,可以咨詢王老師:18766119382(同微信) |