崗位職責
1、負責智能硬件場景下相關(guān)數(shù)據(jù)的全生命周期管理,包括數(shù)據(jù)采集、清洗、存儲與預處理,確保數(shù)據(jù)質(zhì)量符合后續(xù)算法訓練與業(yè)務應用需求;
2、參與數(shù)據(jù)模型的設(shè)計與優(yōu)化,針對動態(tài)場景數(shù)據(jù)特性(如實時性、多源性),構(gòu)建高效的數(shù)據(jù)處理流水線,提升數(shù)據(jù)流轉(zhuǎn)效率;
3、協(xié)同算法、硬件團隊完成多模態(tài)運動數(shù)據(jù)(如傳感信號、時序動作數(shù)據(jù))的融合處理,解決數(shù)據(jù)時空同步、噪聲過濾、異常值檢測等技術(shù)問題;
4、跟蹤數(shù)據(jù)領(lǐng)域前沿技術(shù)(如時序數(shù)據(jù)挖掘、邊緣端數(shù)據(jù)預處理),結(jié)合業(yè)務場景設(shè)計數(shù)據(jù)創(chuàng)新應用方案,支撐產(chǎn)品核心功能落地;
5、撰寫數(shù)據(jù)相關(guān)技術(shù)文檔,沉淀數(shù)據(jù)處理規(guī)范與最佳實踐,協(xié)助團隊提升數(shù)據(jù)管理與應用效率。
技能要求
1、精通數(shù)據(jù)處理核心技術(shù),包括但不限于:
a) 數(shù)據(jù)采集與預處理:熟悉多源數(shù)據(jù)(傳感、時序、日志數(shù)據(jù))采集方法,掌握數(shù)據(jù)清洗(缺失值填充、異常值剔除)、特征工程(時序特征提取、數(shù)據(jù)標準化)等技術(shù);
b) 數(shù)據(jù)存儲與計算:熟悉時序數(shù)據(jù)庫(如 InfluxDB、TimescaleDB)、關(guān)系型數(shù)據(jù)庫(MySQL)及分布式計算框架(Spark、Flink),能根據(jù)數(shù)據(jù)量級選擇適配的存儲與計算方案;
c) 數(shù)據(jù)質(zhì)量管控:具備數(shù)據(jù)質(zhì)量評估體系搭建能力,能設(shè)計數(shù)據(jù)完整性、準確性、實時性監(jiān)控指標,確保數(shù)據(jù)可用率≥98%;
2、掌握數(shù)據(jù)特性分析方法,能針對動態(tài)場景數(shù)據(jù)(如動作時序、實時傳感信號)設(shè)計專屬預處理方案,降低數(shù)據(jù)噪聲對后續(xù)應用的影響;
3、熟練使用 Python/R 等數(shù)據(jù)處理語言,熟悉 Pandas、NumPy、Scikit-learn 等工具庫,具備一定的數(shù)據(jù)分析與可視化基礎(chǔ)(能生成數(shù)據(jù)質(zhì)量報告、趨勢圖表);
4、了解智能硬件數(shù)據(jù)傳輸協(xié)議(如 MQTT、HTTP),能協(xié)同硬件團隊優(yōu)化數(shù)據(jù)采集頻率與傳輸效率,平衡數(shù)據(jù)完整性與硬件能耗;
5、具備邊緣端數(shù)據(jù)處理經(jīng)驗(如數(shù)據(jù)降采樣、本地特征提?。?,能適配資源受限設(shè)備(如邊緣服務器、嵌入式設(shè)備)者優(yōu)先。
經(jīng)驗要求
1、本科及以上學歷,數(shù)據(jù)科學、計算機科學與技術(shù)、統(tǒng)計學、電子信息工程等相關(guān)專業(yè);
2、3年及以上數(shù)據(jù)、時序數(shù)據(jù)或智能硬件數(shù)據(jù)處理經(jīng)驗;
3、具備從 0 到 1 搭建數(shù)據(jù)處理體系的實際經(jīng)驗,能獨立完成數(shù)據(jù)需求拆解、方案設(shè)計到落地優(yōu)化的全流程者優(yōu)先。