算法工程师

D

Deepcoin

Internship

Remote

岗位职责

你将参与以下一个或多个方向（按兴趣与背景匹配）：

对话与语言模型方向

大模型微调、量化（GPTQ / AWQ / GGUF）、推理加速（vLLM / SGLang / TensorRT-LLM）；
围绕 Agent 框架做 Prompt 设计、工具调用（Function Calling）、意图识别与路由；
RAG 流水线优化：检索召回、重排、知识图谱融合、长上下文压缩。

Agent Harness 方向（自研框架核心）

参与自研 Agent Harness 的设计与迭代：上下文窗口管理、工具调用解析、流式与中断、错误恢复、SubAgent 编排；
复现并对比 OpenClaw / Hermes / Claude Agent SDK / LangGraph 等开源 Harness 的关键设计，沉淀到自研框架；
在 SWE-bench / Terminal-Bench / τ-bench 等公开 Agent 基准上做评测与消融，推动 Harness 各模块的版本迭代；
设计 Agent 的 Tracing、Replay、Eval 基础设施，让每一次 prompt / 工具改动都有可量化的回归依据。

Agent 记忆系统方向

设计与实现多层级记忆架构：会话级工作记忆、跨会话情节记忆、用户画像式语义记忆；
调研与落地 Mem0 / Zep / LangMem 等开源方案，或基于向量数据库（Qdrant / Milvus / pgvector）自研；
解决记忆冲突合并、衰减策略、检索精度与召回延迟之间的平衡。

语音方向

流式 ASR的部署、定制词表、领域口音适配；
TTS 模型的低延迟流式合成、CUDA Graph 优化；
VAD、端点检测（EOT / Turn Detection）、语义级轮次判断。

任职要求

计算机、人工智能、电子、数学等相关专业本科及以上在读，每周到岗 ≥ 5 天，连续实习 ≥ 6 个月；
PyTorch 熟练，看得懂主流模型代码（Transformers 等），能独立训练与调优；
熟悉至少一个方向的主流模型族（LLM / ASR / TTS / Retrieval）原理与代表性论文，或对 Agent 系统设计有自己的理解；
Python 工程能力扎实，熟悉 asyncio、FastAPI、Linux + GPU 开发环境；
对前沿技术有热情，会主动跟 arXiv / GitHub 趋势，看到新模型 / 新 Agent 框架愿意自己跑一跑。

加分项

有 SOTA 模型微调、蒸馏、量化或推理优化的实战经验；
熟悉 vLLM / SGLang / TensorRT / Triton 等推理框架的源码或配置；
读过或自己实现过 Agent Harness（OpenClaw / Hermes / Claude Agent SDK / smolagents / LangGraph 任一）；
在 SWE-bench / Terminal-Bench / GAIA / τ-bench 等 Agent benchmark 上跑过实验，了解 Harness 设计如何影响最终分数；
用过或读过 Mem0 / Zep / LangMem / LlamaIndex 的核心实现；
在 HuggingFace、GitHub 有过开源贡献，或有 Kaggle / AI 评测竞赛获奖经历；

我们能提供

多卡 GPU 集群直接可用，不用排队抢资源；
接触当下最前沿的开源模型与 Agent 框架，从论文到生产化的完整链路；
直接参与一套真正在生产环境跑的 Agent Harness 的设计演进，而不是套壳调 API；
与 senior 工程师 1-on-1 协作，没有中间层、没有 PPT 文化；
表现优秀者优先转正 / Return Offer，或长期 RA / 兼职合作；
灵活工作方式（远程）。