数据核心速览数据编号2343时间跨度2007–2025样本范围A 股上市公司剔除 ST、金融、公用事业及异常样本数据来源上市公司年报 谷歌中国全量专利库数据格式Excel 企业年度面板测算范式复刻《经济管理》杨鹏等2025顶刊口径 指标测算方法统计每位发明人年度专利申请量每年专利申请量排名前 5%定义为超级明星发明家企业层面汇总超级明星发明家数量构造虚拟变量企业当年是否拥有明星发明家0-1。 核心字段股票代码统计截止日期公司中文全称年份超级明星发明家数量超级明星发明家虚拟变量 适用研究方向明星发明家与企业创新产出、专利质量、研发效率核心人力资本对企业全要素生产率、高质量发展影响数字技术、数字化转型与明星发明家协同创新效应高管团队、人才结构、知识溢出与企业创新网络异质性分析行业、产权、研发投入的调节作用时间跨度2007-2025区域跨度上市公司数据格式Excel形式数据简介根据知识资源基础观知识的获取与整合高度依赖人力载体尤其是具备深厚专业知识储备、突出创新能力及高产专利成果的超级明星发明家。作为企业内外部知识积累的核心人力资本他们能显著增强数字技术对协同创新的赋能效应一方面凭借行业声望与广泛合作网络他们可依托数字技术高效筛选创新合作伙伴并促成合作同时通过数字化工具加速外部知识获取另一方面其丰富的知识积累与创新经验能提升知识整合效率在数字技术支持下快速识别高价值外部知识指导团队深掘并加速转化为创新成果。因此为了方便大家在企业合作创新方面的研究我们参考杨鹏尹志锋和孙宝文等2025的公司样本主表筛选法数据来源层面主表- 在上市公司年报数据中选择2007-2025年中国A股上市公司研究样本- 剔除所有的ST样本- 剔除金融行业和公用事业行业的样本- 剔除存在异常值的样本资产负债率大于1或小于0- 剔除企业规模、年龄等关键控制变量缺失的样本我们自己根据剔除完后的名单基于股票代码匹配上市公司年报基本信息数据以获取每家上市公司中文全称同时“截止日期”也是基于该基本信息表因此部分公司的对应年份未包含2025。另外该表中部分公司的中文全称在不同年份间有一两个字符差别我们全部统一为第一次出现的名称。数据来源层面副表- 选择谷歌中国专利数据- 基于专利申请年份仅选取2007-2025年的专利同时为方便计算选择专利数据中的“格式化申请号”,“专利申请日期”,“发明人”,“专利受让人”这四个字段。- 需要说明的是原始谷歌中国专利数据中有部分数据值为列表形式所以我们做了纵向拉伸处理方便计算。接着我们再参考杨鹏尹志锋和孙宝文等2025的做法来计算超级明星发明家StarInventors1. 基于专利数据中的“发明人”统计每位发明人每年的专利申请数量2. 将每年专利申请量排名前5%的发明人界定为超级明星发明家3. 在企业层面汇总该指标为“超级明星发明家数量”指每年每家企业拥有的超级明星发明家数量。4. 根据企业当年是否拥有至少一位超级明星发明家构建二元虚拟变量进行测度“超级明星发明家”数据指标股票代码统计截止日期中文全称年份超级明星发明家数量超级明星发明家数据展示参考文献[1]杨鹏,尹志锋,孙宝文,等.数字技术应用与企业合作创新[J].经济管理,2025,47(01):108-127.