A.對分析結果進行可視化呈現,幫助人們更好地理解數據、分析數據
B. 利用網頁爬蟲程序到互聯網網站中爬取數據
C.利用ETL工具將分布的、異構數據源中的數據,抽取到臨時中間層后進行清洗、轉換、集成,最后加載到數據倉庫或數據集市中
D.利用日志采集工具把實時采集的數據作為流計算系統(tǒng)的輸入,進行實時處理"/>
新聞詳情
國家開放大學高起專真題《大數據技術概論》1052
發(fā)表時間:2022-12-29 11:40 大數據技術概論
一 、單選題 1、 以下哪個步驟不屬于數據的采集與預處理: A.對分析結果進行可視化呈現,幫助人們更好地理解數據、分析數據 B. 利用網頁爬蟲程序到互聯網網站中爬取數據 C.利用ETL工具將分布的、異構數據源中的數據,抽取到臨時中間層后進行清 洗、轉換、集成,最后加載到數據倉庫或數據集市中 D.利用日志采集工具把實時采集的數據作為流計算系統(tǒng)的輸入,進行實時處理 分析 正確答案:A 2、 以下哪項不屬于數據清洗的內容: A. 一致性檢查 B. 精確度校驗 C.無效值和缺失值的處理 D.成對刪除 正確答案:B 3、 以下哪項不屬于傳統(tǒng)的數據存儲和管理技術: A.NoSQL數據庫 B. 文件系統(tǒng) C. 數據倉庫 D.關系數據庫 正確答案:A 4、 以下關于分布式文件系統(tǒng),描述錯誤的是: A. 所有的分布式文件系統(tǒng)的設計都是采用“客戶機/服務器” (Client/Server) 模式 B.Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)是針對 GFS的開源實現 C. 谷歌開發(fā)了分布式文件系統(tǒng)GFS D.是一種通過網絡實現文件在多臺主機上進行分布式存儲的文件系統(tǒng) 正確答案:A 5、 以下描述錯誤的是: A. 傳統(tǒng)的關系數據庫由于數據模型不靈活、水平擴展能力較差等局限性,已經 無法滿足各種類型的非結構化數據的大規(guī)模存儲需求 B.Web 2.0的迅猛發(fā)展以及大數據時代的到來,使關系數據庫的發(fā)展越來越力不 從心 C. 傳統(tǒng)關系數據庫引以為豪的一些關鍵特性,如事務機制和支持復雜查詢,在 Web 2.0時代成為不可或缺的核心特性 D.傳統(tǒng)的關系數據庫可以較好地支持結構化數據存儲和管理 正確答案:C 6、 以下關于NoSQL數據庫描述錯誤的是: A.NoSQL是一種不同于關系數據庫的數據庫管理系統(tǒng)設計方式,是對非關系型數 據庫的統(tǒng)稱 B. 與關系數據庫相比,NoSQL具有靈活的水平可擴展性,可以支持海量數據存儲 C.NoSQL數據庫有固定的表結構,通常存在較多連接操作 D.NoSQL所采用的數據模型并非傳統(tǒng)關系數據庫的關系模型,而是類似鍵/值、 列族、文檔等非關系模型 正確答案:C 7、 下面屬于批處理技術的是: A.Spark Streaming
B. MapReduce
C.Storm D.GraphX 正確答案:B 8、 下面屬于流計算技術的是: A. S4 B. Hive C.Spark MLLib D.GraphX 正確答案:A 9、 下面屬于圖計算技術的是: A.Dremel B.Impala C.Pregel
D.DStream 正確答案:C 10、 下面屬于查詢分析計算技術的是: A.Pregel
B.Storm C.Spark Streaming
D.Hive 正確答案:D 二、 多選題 1、數據采集的三大要點是: A. 高效性 B.全面性 C.多維性 D. 精確性 正確答案:A、B、C 2、數據采集的主要數據源包括: A. 傳感器數據 B. 企業(yè)業(yè)務系統(tǒng)數據 C. 日志文件 D. 互聯網數據 正確答案:A、B、C、D 3、需要清洗的數據的主要類型包括: A. 殘缺數據 B. 重復數據 C. 錯誤數據 D. 干凈數據 正確答案:A、B、C 4、數據倉庫的特性包括: A. 相對穩(wěn)定的 B. 面向主題的 C. 反映歷史變化的 D. 集成的 正確答案:A、B、C、D 5、NoSQL數據庫具有以下幾個特點: A. 與云計算緊密融合 B. 靈活的可擴展性 C. 靈活的數據模型 D. 數據模型比較死板 正確答案:A、B、C 6、典型的機器學習和數據挖掘算法包括: A. 聚類 B. 分類 C. 正交 D. 回歸分析 正確答案:A、B、D 7、大數據處理分析技術類型主要包括: A. 查詢分析計算 B.批處理計算 C. 流計算 D. 圖計算 正確答案:A、B、C、D 8、在大數據時代,可視化技術可以支持實現多種不同的目標,主要包括: A. 增強數據吸引力 B. 觀測、跟蹤數據 C. 輔助理解數據 D.分析數據 正確答案:A、B、C、D 9、數據安全技術種類繁多,主要包括: A. 防火墻技術 B. 可視化技術 C. 訪問控制技術 D. 身份認證技術 正確答案:A、C、D 以上就是關于國家開放大學高起專真題《大數據技術概論》,如果想要咨詢關于國家開放大學的任何問題,可以咨詢王老師:18766119382(同微信) |