本人目前在猿辅导公司担任高级AI算法程序员,从事相关工作已有8年。项目经历包括:大语言模型、多模态模型、增强检索生成(RAG)、计算机视觉、自然语言处理、搜索、机器车视觉、视频算法、座舱视觉感知、算法工程(SDK、Agent部署)等。最早接触相关工作是从本科毕设的DQ二维码识别开始,读研期间也一直在从事相关工作的研究,具备坚实的理论功底。
近几年工作成果是:
- 2022至2024年:英语作文批改与润色(大语言模型)、你画AI猜(多模态模型)、作业美化(视觉)。全部线上使用,并受到教师与学生的广泛好评。会话缓存服务,减少了第三方模型请求,为公司节约了大量成本,独立完成了中文作文知识点、产品手册多Agent的RAG服务。共完成12项算法发明专利,其中大模型相关专利2项、多模态大模型相关专利1项、原创算法发明专利2项;期间还做了工业多模态大模型平台搭建与模型微调(网址:http://112.245.58.16:8852/),利用稀疏注意力检测模型搭建数据自动标注平台(网址:http://112.245.58.16:8851/);
- 2022年:获得中国科学院颁发的人工智能中级职称,搭建视频画质分析框架,可以对画质进行静态分析,画质增强badcase分类,画质智能增强策略,期间完成1项原创算法发明专利;
- 2020至2021年:完成移动端视频超帧算法,在技术上突破了移动端只能利用芯片进行超帧的壁垒,达到使用软件算法可以进行视频超帧的效果。完成6项原创算法发明专利,原创视频超帧率算法在相关数据集测试达到the-state-of-art水平,具体详见:https://github.com/lzylyx/VFI_FMSMI;
- 2019年:完成机器车端仪表指针表的自动示数识别,该原创技术首次突破了用人眼读表的精度,为公司与南京华润燃气公司、巴斯夫公司的合作中带来了经济效益,期间完成1项原创算法发明专利;
- 2018年:独立完成Alpha Note App的智能扫描SDK,该APP已经上架,为公司带来了经济效益,期间完成1项原创算法发明专利。带领团队开发了PDF文档转Word文档的字符识别系统;
职业技能
-
编程语言
c、c++、python、java、c#、shell、html -
专业
opencv、dlib、ffmpeg、kornia、nltk、jieba、pillow、skimage... -
AI
框架:pytorch、tensorflow,深度学习与大模型:transformers、vllm、diffusers、deepspeed、faiss、pymilvus、openai、langchain、llamaindex、autogen -
工程
平台:linux、windows、android、ros,数据库:mysql、sqlite,编译:make、cmake,优化与移植:cuda、onnx、libtorch、opencl、tensorrt、snpe、ncnn、mace,部署:http、rpc -
科研
能快速复现论文代码并优化,完成技术发明专利及论文撰写