Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Appearance settings
Discussion options

【岗位职责】

  1. 基于Docker镜像搭建可复现的标准化测试环境,准确复现已知问题或按指定流程生成预期输出
  2. 检查与完善现有单元测试的覆盖度与有效性,评估目标代码的正确性与稳定性
  3. 验证测试集的完整性与合理性,确保SWE-Bench与Terminal-Bench相关任务的工作流各环节精确对应
  4. 编写高质量的任务文档(task.yaml/README),重视复现性和标准化流程
    【任职要求】
  5. 必备技能:
  • 熟练掌握Linux命令行及Shell脚本编写,熟练使用grep/sed/awk/curl/jq等工具
  • 精通Python编程,能编写task harness、测试用例和自动化工具
  • 熟练使用Docker,能够编写Dockerfile并构建可复现环境
  • 熟悉pytest等测试框架,能编写结构化单元测试,掌握mock数据和控制随机性技术
  • 熟悉Git/GitHub工作流,能够提交高质量、可复现的PR
  1. 专业背景:
  • 计算机科学、软件工程、人工智能等相关专业/有软件开发、测试工程、DevOps、数据工程等相关岗位经验
  • 开源项目贡献者(尤其是自动化测试、CI/CD、容器化方向)优先
  1. 加分项:
  • 掌握Go/Rust等高性能语言
  • 熟悉Docker Compose/Podman等其他sandbox技术
  • 具备数据集/任务设计能力,能防止"任务作弊"
  • 理解benchmark设计的科学性(公平性、可重复性、可扩展性)
  • 有自动化测试系统或CI/CD经验,具备跨学科视角
    【薪资待遇】
    日薪500-800元人民币,根据实际能力和经验水平浮动

有意者请添加wechat:watermelono2025

You must be logged in to vote

Replies: 0 comments

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
1 participant
Morty Proxy This is a proxified and sanitized view of the page, visit original site.