史其诺

统计学硕士 | 数据科学家

专注于机器学习、数据分析和统计建模,致力于通过数据驱动的方法解决实际问题

13383833504
13383833504@163.com

教育背景

2024年9月 - 至今

明尼苏达大学双城分校

University of Minnesota Twin Cities, Minneapolis, MN

统计学硕士(Master of Statistics)

2020年8月 - 2024年4月

俄亥俄州立大学

Ohio State University, Columbus, OH

数学理学学士(Bachelor of Science in Mathematics)

项目经历

肿瘤分类研究(机器学习)

2025年1月 - 2025年5月

研究基于细针抽吸(FNA)样本的乳腺肿瘤诊断问题,应用图像处理和机器学习技术提取细胞核特征并进行分类。

  • 采用 Active Contour Models 自动识别细胞核边界
  • 提取半径、紧致度、凹陷度、对称性等10种特征
  • 应用 Gradient Boosting 构建分类模型
  • 通过 ten-fold cross validate 评估模型性能,达到97%准确率
机器学习 图像处理 Python 医疗AI

基于图嵌入的基因-疾病关联预测

2025年1月 - 2025年5月

使用 DisGeNET 构建异构图用于基因-疾病关联建模,比较了多种图神经网络方法。

  • 基于 PyTorch Geometric 实现 GCN、GraphSAGE 和 Node2Vec
  • Node2Vec 表现最佳(AUC = 0.908,AP = 0.897)
  • 设计融合模型综合三种方法的嵌入
  • 利用 t-SNE 可视化嵌入空间
图神经网络 PyTorch 生物信息学 深度学习

房产预测(机器学习)

2024年10月 - 2024年12月

基于台北市房地产数据,进行数据预处理、特征工程和模型构建,预测房价。

  • 使用中位数、众数、均值处理缺失值
  • 应用 Interquartile Range 进行数据清洗
  • 使用 Generalized Additive Models 查找非线性关系
  • Random Forest 在预测房价方面表现最佳
数据分析 特征工程 回归分析 R语言

贝尔纲定理的研究与证明

2023年1月 - 2023年4月

深入研究了 Baire's Category Theorem 在实数集上的应用,通过反证法进行严格的数学证明。

  • 研究实数集不能被表示为若干个稠密的补集的可数并集
  • 构造一系列闭的、有界的嵌套区间序列
  • 运用实分析的概念理解该定理
  • 进行综合演示,提升数学表达能力
数学分析 实分析 定理证明 LaTeX

技能专长

编程语言

Python
R语言
SQL
Java
LaTeX

机器学习

深度学习 图神经网络 计算机视觉 自然语言处理 时间序列分析 集成学习

数据分析

统计建模 数据可视化 特征工程 A/B测试 回归分析 假设检验

工具框架

PyTorch TensorFlow Scikit-learn Pandas NumPy Matplotlib Seaborn Git

联系我

让我们一起合作

如果您对我的项目感兴趣,或者有合作机会,欢迎随时联系我。

电话

13383833504

邮箱

13383833504@163.com

位置

Minneapolis, MN, USA