- 相關推薦
大數據面試常見問題
掌握一些面試常見問題,能讓自己面試時更有把握,今天小編為大家準備了大數據面試常見問題,歡迎閱讀!
大數據面試常見問題
1、你處理過的最大的數據量?你是如何處理他們的?處理的結果。
2、告訴我二個分析或者計算機科學相關項目?你是如何對其結果進行衡量的?
3、什么是:提升值、關鍵績效指標、強壯性、模型按合度、實驗設計、2/8原則?
4、什么是:協同過濾、n-grams, map reduce、余弦距離?
5、如何讓一個網絡爬蟲速度更快、抽取更好的信息以及更好總結數據從而得到一干凈的數據庫?
6、如何設計一個解決抄襲的方案?
7、如何檢驗一個個人支付賬戶都多個人使用?
8、點擊流數據應該是實時處理?為什么?哪部分應該實時處理?
9、你認為哪個更好:是好的`數據還是好模型?同時你是如何定義“好”?存在所有情況下通用的模型嗎?有你沒有知道一些模型的定義并不是那么好?
10、什么是概率合并(AKA模糊融合)?使用SQL處理還是其它語言方便?對于處理半結構化的數據你會選擇使用哪種語言?
11、你是如何處理缺少數據的?你推薦使用什么樣的處理技術?
12、你最喜歡的編程語言是什么?為什么?
13、對于你喜歡的統計軟件告訴你喜歡的與不喜歡的3個理由。
14、SAS, R, Python, Perl語言的區別是?
15、什么是大數據的詛咒?
16、你參與過數據庫與數據模型的設計嗎?
17、你是否參與過儀表盤的設計及指標選擇?你對于商業智能和報表工具有什么想法?
18、你喜歡TD數據庫的什么特征?
19、如何你打算發100萬的營銷活動郵件。你怎么去優化發送?你怎么優化反應率?能把這二個優化份開嗎?