崗位職責:
1. 基礎數(shù)據(jù)與測試集構建
數(shù)據(jù)采集與標注:負責測試集數(shù)據(jù)的采集、清洗、校對和分類整理,為AI模型(如OCR、NLP模型)優(yōu)化提供數(shù)據(jù)支持。
2. 測試執(zhí)行與問題記錄
功能與性能測試:依據(jù)測試計劃,對搭建的智能體、AI應用、機器人執(zhí)行功能測試(交互響應、任務準確性)、性能測試(響應時間、吞吐量)及穩(wěn)定性測試。
3. 效果評價:評測AI產品的質量(如機器人穩(wěn)定性、任務成功率、識別準確率等任務),做好質量評測。
任職要求:
1.教育背景:本科或碩士在讀,計算機科學、人工智能、軟件工程、數(shù)學、電子信息等相關專業(yè)優(yōu)先。
2.編程能力:
熟悉至少一種編程語言(Python為主,或Java/JavaScript),能夠閱讀和理解代碼邏輯。
3.有基礎的腳本編寫能力,能夠處理數(shù)據(jù)或搭建簡單測試腳本。
4.AI基礎知識:
對機器人、人工智能、機器學習、深度學習有濃厚興趣,了解大模型、NLP/CV等基本概念。
5.了解主流大模型評測基準(如MMLU、MT-Bench、TruthfulQA等)者優(yōu)先。
6.工具使用:了解Postman/JMeter等接口測試工具,或Selenium/Pytest等自動化測試框架者優(yōu)先。