hackquest logo

算法工程师

D

Deepcoin

Internship
Remote

岗位职责

你将参与以下一个或多个方向(按兴趣与背景匹配):

对话与语言模型方向


  • 大模型微调、量化(GPTQ / AWQ / GGUF)、推理加速(vLLM / SGLang / TensorRT-LLM);
  • 围绕 Agent 框架做 Prompt 设计、工具调用(Function Calling)、意图识别与路由;
  • RAG 流水线优化:检索召回、重排、知识图谱融合、长上下文压缩。


Agent Harness 方向(自研框架核心)


  • 参与自研 Agent Harness 的设计与迭代:上下文窗口管理、工具调用解析、流式与中断、错误恢复、SubAgent 编排;
  • 复现并对比 OpenClaw / Hermes / Claude Agent SDK / LangGraph 等开源 Harness 的关键设计,沉淀到自研框架;
  • 在 SWE-bench / Terminal-Bench / τ-bench 等公开 Agent 基准上做评测与消融,推动 Harness 各模块的版本迭代;
  • 设计 Agent 的 Tracing、Replay、Eval 基础设施,让每一次 prompt / 工具改动都有可量化的回归依据。


Agent 记忆系统方向


  • 设计与实现多层级记忆架构:会话级工作记忆、跨会话情节记忆、用户画像式语义记忆;
  • 调研与落地 Mem0 / Zep / LangMem 等开源方案,或基于向量数据库(Qdrant / Milvus / pgvector)自研;
  • 解决记忆冲突合并、衰减策略、检索精度与召回延迟之间的平衡。


语音方向


  • 流式 ASR的部署、定制词表、领域口音适配;
  • TTS 模型的低延迟流式合成、CUDA Graph 优化;
  • VAD、端点检测(EOT / Turn Detection)、语义级轮次判断。


任职要求

  • 计算机、人工智能、电子、数学等相关专业本科及以上在读,每周到岗 ≥ 5 天,连续实习 ≥ 6 个月
  • PyTorch 熟练,看得懂主流模型代码(Transformers 等),能独立训练与调优;
  • 熟悉至少一个方向的主流模型族(LLM / ASR / TTS / Retrieval)原理与代表性论文,或对 Agent 系统设计有自己的理解;
  • Python 工程能力扎实,熟悉 asyncio、FastAPI、Linux + GPU 开发环境;
  • 对前沿技术有热情,会主动跟 arXiv / GitHub 趋势,看到新模型 / 新 Agent 框架愿意自己跑一跑。


加分项

  • 有 SOTA 模型微调、蒸馏、量化或推理优化的实战经验;
  • 熟悉 vLLM / SGLang / TensorRT / Triton 等推理框架的源码或配置;
  • 读过或自己实现过 Agent Harness(OpenClaw / Hermes / Claude Agent SDK / smolagents / LangGraph 任一);
  • 在 SWE-bench / Terminal-Bench / GAIA / τ-bench 等 Agent benchmark 上跑过实验,了解 Harness 设计如何影响最终分数;
  • 用过或读过 Mem0 / Zep / LangMem / LlamaIndex 的核心实现;
  • 在 HuggingFace、GitHub 有过开源贡献,或有 Kaggle / AI 评测竞赛获奖经历;



我们能提供

  • 多卡 GPU 集群直接可用,不用排队抢资源;
  • 接触当下最前沿的开源模型与 Agent 框架,从论文到生产化的完整链路;
  • 直接参与一套真正在生产环境跑的 Agent Harness 的设计演进,而不是套壳调 API;
  • 与 senior 工程师 1-on-1 协作,没有中间层、没有 PPT 文化;
  • 表现优秀者优先转正 / Return Offer,或长期 RA / 兼职合作;
  • 灵活工作方式(远程)。