資料探勘工程師的主要職責表述

  資料探勘工程師需要整理行業案例,深入研究分析市場需求趨勢、行業知識及發展方向,並進行行業案例與解決方案的包裝和推廣。下面是小編為您精心整理的。

  1

  職責:

  1、負責海量科技資料***含文字資料***的挖掘工作;

  2、負責科技資料探勘演算法模型的構建、應用、評測、報告;

  3、主持或參與海量科技資料的入庫工作,科技資料知識圖譜的構建;

  4、負責或參與資料探勘成果論文、專利、標準的撰寫;

  5、負責或參與制定資料加工清洗的方案,並形成操作手冊;

  6、為指定的課題提出解決方案,並主持或參與方案實施;

  7、完成安排的各項工作,與其他部門合作。

  崗位要求:

  1、數學、統計、金融、科技管理、計算機等相關專業,博士學歷優先;

  2、具有2年及以上海量資料探勘經驗,有文字挖掘、非結構化文字處理經驗者優先;

  3、精通Matlab/Python/R/Scala之一,熟悉Java/C/C++等程式語言,熟練掌握Linux各項操作指令;

  4、熟練掌握Hadoop/Spark/Storm/Kafka中的一項或幾項,有MPI經驗者尚佳;

  5、掌握機器學習的基本演算法框架,有自然語言處理和豐富的特徵工程***特徵選擇/特徵抽取***經驗者優先;

  6、掌握關係型資料庫的基本操作,有圖形資料庫、其他非關係型資料庫經驗者尚佳;

  7、在醫療資訊化從事產品開發工作者優先,有頂會paper或人工智慧領域國際比賽中獲獎者優先;

  8、有比較強的組織協調能力,可同時處理好多個任務,具備一定的管理能力;

  9、性格開朗,具有團隊精神;較強的溝通能力,能與相關業務和開發人員討論並快速理解需求。

  2

  職責:

  對業務資料進行採集、清洗、整理、標籤、分層;

  根據業務需求,應用統計學、資料探勘等建立精準資料模型,滿足業務需求;

  能從業務和產品角度出發,利用資料來發現產品或業務的瓶頸,提出優化方案;

  探索業界和學術界前言的資料探勘、機器學習理論與實踐。

  任職資格:

  本科及以上學歷,數學、統計學、計算機專業優先;

  精通資料探勘指令碼語言,能靈活運用R、Python中的一種,熟練sklean/numpy/pandas等科學計算相關庫,有統計建模、機器學習或資料探勘應用的專案經驗優先;

  對大資料技術有深入瞭解,能夠使用Hadoop、spark等相關技術;

  勤奮踏實,樂於學習新事物,有良好團隊合作精神和高度的責任感;

  醫療、生物背景人員優先。

  3

  職責:

  1.負責大資料專案需求調研及分析、模型設計工作。

  2.負責規劃資料探勘的整體流程,並參與使用者產品和資料產品的決策。

  3.與業務部門密切配合,尋求資料層面的業務價值,利用資料分析結論推動產品優化。

  4.帶領團隊對於產品資料進行分析,指導工程師完成資料探勘相關的演算法、應用的設計與開發。

  5.技術團隊的管理,制定開發規範,撰寫相關技術文件指導和培訓工程師。

  任職要求:

  1.計算機、數學、統計等相關專業本科以及以上學歷;兩年及以上工作經驗。

  2.具備良好的資料結構和演算法基礎。

  3.熟練掌握資料探勘演算法模組關聯分析、聚類分析、分類分析、迴歸分析裡的經典演算法。

  4.熟悉深度學習裡的經典神經網路,包括並不限於MLP/CNN/RNN。

  5.熟悉Python, Java等常用程式語言。

  6.熟悉分散式資料處理系統的開發,Hadoop/Spark/Hive等。

  7.全面瞭解機器學習應用於實際問題的完整流程,有相關實際專案經驗。

  4

  職責:

  1、負責大資料平臺數據倉庫建設、資料分析挖掘工作;

  2、負責大資料的處理、整合及資料建模,協同業務開發人員,將模型演算法成果應用到實際業務系統中,並通過視覺化工具進行分析成果展示;

  3、基於使用者資料,研究使用者行為,構建使用者畫像。

  任職要求:

  1、應用數學、計算機、資訊處理等相關專業本科及以上學歷;

  2、3年以上大資料開發經驗;

  3、熟悉hadoop的大資料生態,精通SQL語法【有較好的SQL效能調優能力,掌握基於Hive或者Spark sql的HQL指令碼編寫;

  4、具有從資料查詢,聚合,分析到視覺化的整套實踐經驗;

  5、熟練使用java或者python、基礎紮實、能編寫Hive環境下或者Spark sql環境下的UDF;

  6、具備良好的表達和溝通能力、學習能力,具備極強的團隊合作精神,能夠承受一定的工作壓力。

  5

  職責:

  1. 從事精準醫療領域的大資料管理分析、BI資料探勘;

  2. 熟練使用指令碼工具訪問資料庫,並完成相應的指令碼分析,以圖形介面的方式呈現;

  3. 熟練使用統計或者機器學習演算法,對結構化資料進行統計分析,包括分類和聚類,並進行預測建模等;

  4. 與相關專案開發組溝通,明確其需求並給予資料分析統計結果等支援。

  任職要求:

  1、應用數學,計算機,生物等相關專業碩士以上學歷;

  2、有生命科學、基因、醫藥等生物科技行業2年以上工作經驗;

  3、熟練運用各種常用演算法和資料結構,熟悉常用的機器學習演算法,瞭解各種演算法的優缺點和侷限性;

  4、熟悉R、Python 等資料分析平臺及工具,有搭建hadoop、spark或類似平臺從業經驗;

  5、 熟悉主流資料庫Oracle、MySQL對 NoSql 有一定了解及應用經驗;

  6、 有團隊精神,能夠承擔責任和壓力。