你好,我是 张轩玮

多模态大模型专家 | NLP资深算法专家 | 大模型技术专家

北京大学硕士,专注于多模态大模型,语言大模型,以及自然语言处理领域。 拥有丰富的大模型训练经验,致力于AI技术创新和产业应用。

张轩玮头像

关于我

我是一名专注于AI和大模型领域的技术专家,拥有北京大学电子科学与技术硕士学位。 在元语智能科技担任联合创始人&技术负责人,主导了PromptCLUE和ChatYuan等知名开源大模型项目, 在爱奇艺担任NLP资深算法专家,负责机器翻译、内容理解等核心AI业务。

我是CLUE中文语言理解测评基准的联合创始人,该项目在GitHub获得10k+ stars。 专注于多模态大模型、语言大模型、NLP等前沿技术,发表多篇顶会论文,拥有851引用。 擅长大规模模型训练、系统架构设计和AI产品化落地。

7+ 年AI经验
10k+ GitHub Stars
851 论文引用

工作经历

联合创始人&技术负责人

元语智能科技有限公司

2022年8月 - 2023年8月

  • 主导 PromptCLUE 大模型开发,基于 T5 框架,1.5万亿+ tokens训练
  • 发布 ChatYuan 国内首个中文功能型对话 ChatGPT 模型
  • 在 Hugging Face 和 ModelScope 开源,月累计下载量数万次

NLP资深算法专家

爱奇艺科技有限公司 北京

2017年7月 - 2022年8月

  • 机器翻译项目负责人(年度优秀员工),8种语言BLEU提升7个点
  • 内容标签(A++)项目负责人,效果绝对提升18pp,推荐业务指标明显提升
  • 热点事件聚合(A++)项目负责人,人工评测F-score提升15个点
  • 负责大模型预训练BERT/GPT/TTA等训练和生产,提供基础服务

联合创始人&常务副理事长

中文任务测评基准(CLUE benchmark) 北京

2019年10月 - 至今

  • 负责CLUE/SuperCLUE基准建立,GitHub获得10k+ stars
  • 发表相关论文(NLP顶会COLING2020),引用851次
  • 训练中文预训练模型并开源,主持后台维护和对接
  • 清洗数T中文数据得到数百G高质量中文语料,开放社区使用

技能专长

AI & 大模型

AIGC 预训练大模型 PromptCLUE ChatYuan BERT/GPT Transformer

NLP & 机器学习

机器翻译 内容理解 热点聚合 文本分类 情感分析 对话系统

技术框架

TensorFlow PyTorch Hugging Face Gradio CLIP Stable Diffusion

编程语言 & 工具

Python Java C++ SpringBoot Docker Consul

项目作品

PromptCLUE 大模型

国内首个大规模多任务预训练中文模型,基于T5框架,支持数百种中文NLP任务。

T5 Transformers PyTorch

ChatYuan 对话模型

国内首个中文功能型对话 ChatGPT 模型,支持多轮对话、知识问答和创意写作。

LLaMA InstructGPT RLHF

CLUE 中文语言理解基准

中文自然语言理解权威测评基准,GitHub 10k+ stars,发表COLING2020顶会论文。

BERT Dataset Benchmark

学术成果

0
总引用数
0
h指数
0
发表论文
0
i10指数

主要发表论文

SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark

45 2023
L Xu, Q Dong, C Yu, Y Tian, W Liu, L Li, C Liu, X Zhang
arXiv preprint arXiv:2307.15020
中文大语言模型综合评估基准,专门为评估大规模语言模型在中文任务上的能力而设计,包含多个维度的评估任务。

CLUENER2020: Fine-grained named entity recognition dataset and benchmark for Chinese

125 2020
L Xu, Q Dong, Y Liao, C Yu, Y Tian, W Liu, L Li, C Liu, X Zhang
arXiv preprint arXiv:2001.04351
中文细粒度命名实体识别数据集和基准,为中文NER任务提供高质量标注数据和评估标准。

CLUECorpus2020: A Large-scale Chinese Corpus for Pre-training Language Models

96 2020
L Xu, H Hu, X Zhang, L Li, C Cao, W Liu, J Li, Y Li, K Sun, Y Xu, Y Cui, ...
arXiv preprint arXiv:2003.01355
大规模中文语料库,专为预训练语言模型设计,包含100GB+高质量中文文本数据。

CLUE: A Chinese Language Understanding Evaluation Benchmark

423 2020
L Xu, H Hu, X Zhang, L Li, C Cao, W Liu, J Li, Y Li, K Sun, Y Xu, Y Cui, ...
arXiv preprint arXiv:2004.05986
中文语言理解评估基准,为中文NLP任务提供统一的评估标准和数据集。包含10个任务,覆盖文本分类、阅读理解等多个领域。

更多论文请查看我的 Google Scholar 档案

Google Scholar

联系方式

让我们一起合作

如果您有任何项目需求或技术问题,欢迎随时联系我。我很乐意与您讨论并提供帮助。

[email protected] · 北京,中国