An aspiring machine learning intern with a strong academic background and practical experience in deep learning, model optimization, and data processing. Seeking a challenging internship opportunity to apply and enhance skills in large-scale deep learning model training and optimization.
wang guosong
核心算法负责人 | 多模态医疗报告生成系统优化
Summary
Education
- 南昌大学 硕士研究生, 计算机科学与技术 Grade : 考研总分专业第一、学业奖学金一等奖、2025年“华为杯”全国研究生数学建模竞赛三等奖 Sep 2025 - Present
- 江西财经大学 本科, 经济学 Sep 2021 - Jun 2025
Experience
- 核心算法负责人 多模态医疗报告生成系统优化 Feb 2026 - Present • 3 mos
• 数据流转与训练链路:独立处理 20万份 MIMIC-CXR 数据并搭建多模态训练框架,完成数据清洗、样本组织、 实验管理与版本跟踪。 • 训练效率优化:提取Rad-DINO 视觉特征后,在 MLP 映射层引入平均池化,将视觉特征压缩为8×8(64 Tokens) 输入 Qwen2.5-0.5B,降低训练显存占用并提升训练可行性。 • 先验提示与解耦训练:构建分类器预测 CheXbert 14 类疾病标签,并转化为 Token 作为大模型先验 Prompt; 训练中采用解耦策略(阻断LLM 梯度回传至分类器),使分类器 F1 达60%。 • 训练策略与资源调度:在单卡 PRO6000(96G)限制下,仅解冻 Qwen 后12层进行局部 SFT(显存控制在 40G);设计句级采样对齐方案,基于 RadGraph 提取 1-F1 幻觉率,筛选约 10 万对偏好样本进行 DPO。 • 评估闭环与协作交付:模型在 MIMIC-CXR上CheXbert-P/R/F1达0.62/0.45/0.52,关键指标超越当前 SOTA; 代码基于 Git 全流程管理,跑通核心链路后完成团队交接。
- 第二作者 遮挡车辆重识别(ReID)多任务预训练研究 Nov 2025 - Present • 6 mos
• 科研产出与结果:完成论文《Unified Multi-task Vision Language Pre-training for Occluded Vehicle Re-identification in the Wild》(在投 IEEE TETCI); 模型在 VeRi-776 上取得 mAP 89.8%、Rank-1 97.4%,mAP 较此前 SOTA 提升6.2%。 • 大规模样本处理:结合 VeriWild 与 SAM2 提取的障碍物 Mask,基于物理位置与视角关系独立合成并清洗出 180万图像、40,671 ID 的高仿真遮挡 ReID 数据集。 • MAE 视角重构:复用SAM 分割获取的车辆4个局部视角先验(前/后/侧/顶),将 MAE 任务扩展为像素级 视角分类(5分类),引导模型隐式学习车辆的 3D 几何与视角感知能力。 •基于 CoCoOp 的图文对齐:提取车辆前景特征,通过 MLP 与可学习参数融合生成动态文本提示 将提示输入文本编码器后与视觉特征进行对比学习,训练过程中仅优化 Prompt、MLP 及视觉主干。 • 特征自蒸馏与评估:引入旋转视图特征与原图 CLS Token 的自蒸馏损失,增强模型对复杂视角变化的旋转不 变性与鲁棒性,并通过 mAP/Rank-1 指标进行方案对比评估。
Skills
- 机器学习训练与优化Expert
- 特征与样本处理Expert
Languages
- 中文Native speaker
- EnglishNative speaker