你好，我是张轩玮

AIGC专家 | NLP资深算法专家 | 大模型技术专家

北京大学硕士，专注于AIGC、预训练大模型和自然语言处理领域。拥有丰富的大模型训练经验，致力于AI技术创新和产业应用。

关于我

我是一名专注于AI和大模型领域的技术专家，拥有北京大学电子科学与技术硕士学位。在元语智能科技担任联合创始人&技术负责人，主导了PromptCLUE和ChatYuan等知名开源大模型项目，在爱奇艺担任NLP资深算法专家，负责机器翻译、内容理解等核心AI业务。

我是CLUE中文语言理解测评基准的联合创始人，该项目在GitHub获得10k+ stars。专注于AIGC、预训练大模型、NLP等前沿技术，发表多篇顶会论文，拥有851引用。擅长大规模模型训练、系统架构设计和AI产品化落地。

7+ 年AI经验

10k+ GitHub Stars

851 论文引用

工作经历

联合创始人&技术负责人

元语智能科技有限公司

2022年8月 - 2023年8月

主导 PromptCLUE 大模型开发，基于 T5 框架，1.5万亿+ tokens训练
发布 ChatYuan 国内首个中文功能型对话 ChatGPT 模型
在 Hugging Face 和 ModelScope 开源，月累计下载量数万次

NLP资深算法专家

爱奇艺科技有限公司北京

2017年7月 - 2022年8月

机器翻译项目负责人（年度优秀员工），8种语言BLEU提升7个点
内容标签(A++)项目负责人，效果绝对提升18pp，推荐业务指标明显提升
热点事件聚合(A++)项目负责人，人工评测F-score提升15个点
负责大模型预训练BERT/GPT/TTA等训练和生产，提供基础服务

联合创始人&常务副理事长

中文任务测评基准(CLUE benchmark) 北京

2019年10月 - 至今

负责CLUE/SuperCLUE基准建立，GitHub获得10k+ stars
发表相关论文(NLP顶会COLING2020)，引用851次
训练中文预训练模型并开源，主持后台维护和对接
清洗数T中文数据得到数百G高质量中文语料，开放社区使用

技能专长

AI & 大模型

AIGC 预训练大模型 PromptCLUE ChatYuan BERT/GPT Transformer

NLP & 机器学习

机器翻译内容理解热点聚合文本分类情感分析对话系统

技术框架

TensorFlow PyTorch Hugging Face Gradio CLIP Stable Diffusion

编程语言 & 工具

Python Java C++ SpringBoot Docker Consul

项目作品

PromptCLUE 大模型

国内首个大规模多任务预训练中文模型，基于T5框架，支持数百种中文NLP任务。

T5 Transformers PyTorch

源码模型

ChatYuan 对话模型

国内首个中文功能型对话 ChatGPT 模型，支持多轮对话、知识问答和创意写作。

LLaMA InstructGPT RLHF

源码模型

CLUE 中文语言理解基准

中文自然语言理解权威测评基准，GitHub 10k+ stars，发表COLING2020顶会论文。

BERT Dataset Benchmark

源码官网

学术成果

总引用数

h指数

发表论文

i10指数

查看 Google Scholar 档案

主要发表论文

SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark

45 2023

L Xu, Q Dong, C Yu, Y Tian, W Liu, L Li, C Liu, X Zhang

arXiv preprint arXiv:2307.15020

中文大语言模型综合评估基准，专门为评估大规模语言模型在中文任务上的能力而设计，包含多个维度的评估任务。

arXiv 官网

CLUENER2020: Fine-grained named entity recognition dataset and benchmark for Chinese

125 2020

L Xu, Q Dong, Y Liao, C Yu, Y Tian, W Liu, L Li, C Liu, X Zhang

arXiv preprint arXiv:2001.04351

中文细粒度命名实体识别数据集和基准，为中文NER任务提供高质量标注数据和评估标准。

arXiv GitHub

CLUECorpus2020: A Large-scale Chinese Corpus for Pre-training Language Models

96 2020

L Xu, H Hu, X Zhang, L Li, C Cao, W Liu, J Li, Y Li, K Sun, Y Xu, Y Cui, ...

arXiv preprint arXiv:2003.01355

大规模中文语料库，专为预训练语言模型设计，包含100GB+高质量中文文本数据。

arXiv GitHub

CLUE: A Chinese Language Understanding Evaluation Benchmark

423 2020

L Xu, H Hu, X Zhang, L Li, C Cao, W Liu, J Li, Y Li, K Sun, Y Xu, Y Cui, ...

arXiv preprint arXiv:2004.05986

中文语言理解评估基准，为中文NLP任务提供统一的评估标准和数据集。包含10个任务，覆盖文本分类、阅读理解等多个领域。

arXiv 项目首页

更多论文请查看我的 Google Scholar 档案

Google Scholar

你好，我是张轩玮

关于我

工作经历

联合创始人&技术负责人

NLP资深算法专家

联合创始人&常务副理事长

技能专长

AI & 大模型

NLP & 机器学习

技术框架

编程语言 & 工具

项目作品

PromptCLUE 大模型

ChatYuan 对话模型

CLUE 中文语言理解基准

学术成果

主要发表论文

SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark

CLUENER2020: Fine-grained named entity recognition dataset and benchmark for Chinese

CLUECorpus2020: A Large-scale Chinese Corpus for Pre-training Language Models

CLUE: A Chinese Language Understanding Evaluation Benchmark

联系方式

让我们一起合作

你好，我是 张轩玮

关于我

工作经历

联合创始人&技术负责人

NLP资深算法专家

联合创始人&常务副理事长

技能专长

AI & 大模型

NLP & 机器学习

技术框架

编程语言 & 工具

项目作品

PromptCLUE 大模型

ChatYuan 对话模型

CLUE 中文语言理解基准

学术成果

主要发表论文

SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark

CLUENER2020: Fine-grained named entity recognition dataset and benchmark for Chinese

CLUECorpus2020: A Large-scale Chinese Corpus for Pre-training Language Models

CLUE: A Chinese Language Understanding Evaluation Benchmark

联系方式

让我们一起合作

你好，我是张轩玮