Workflow
股票名称相似度
icon
Search documents
上市公司股票名称相似度文本数据1990-2025
Sou Hu Cai Jing· 2025-04-05 02:48
数据简介 数据格式 数据格式为Excel形式 股票名称相似度是指通过量化分析不同股票名称之间的文本相似性,评估它们在名称结构、语义、行业 关联等方面的接近程度。这种相似性不仅体现在字面拼写(如"腾讯控股"与"腾讯音乐"),还可能涉及 行业关键词(如"新能源""科技"等)、地域特征(如"上海""深圳")或企业属性(如"集团""股份")的 关联。股票名称相似度具有丰富的科研价值:一、可以对市场异常行为进行监控,通过分析股票名称相 似度和股价波动的关系识别市场操纵或非理性投资(2015年匹凸匹改名事件);二、可以判断投资者行 为是否存在认知偏差,通过构建名称相似度因子,量化名称对投资者决策的影响;三、可以判断股价是 否合理,通过股票名称相似度,可以判断投资者是否因为相似名称而误判了企业的发展趋势。本数据通 过使用Levenshtein距离和Jaccard距离来构建上、京、深交易所A股非ST的上市公司股票名称相似度,在 计算得到企业与其他所有早于该企业上市且不在同一行业和同一地区的企业之间的Levenshtein和Jaccard 距离均值后,通过将均值映射到[0-100]范围内得到每一个企业的股票名称相似系数。 数据 ...