本帖最后由 中国资料 于 2026-2-1 16:39 编辑
地级市环境政策不确定性数据
最新版数据已整理为Excel格式,数据的时间区间为2000-2025年,内含“数据+计算方法+数据来源+参考文献”,欢迎下载!
最新版已整理为Excel格式。
参考 Baker 等(2016)的指数构建方法,选择中国知网报纸数据库中 460 份报纸作为文本分析的数据来源,构建了中国城市层面的环境政策不确定性指数。这460 份报纸广泛分布于中国 31 个省、市和自治区的 267 个城市,因而具有广泛的代表性。我们首先从环境、政策、不确定性三个维度构建了用于定义环境政策不确定性的关键词词库,若一篇新闻报道同时包含至少一个“环境”“政策”和“不确定性”关键词,则认为此文章为目标文章。其次,为了降低不同报纸发表报道总数量带来的偏差,我们用目标文章数量除以该月内该报纸发表文章的总数量,对该数值进行正态化处理,然后用该值扩大 100 倍并除以该值的序列平均值。最后,采用算术平均法计算得到中国城市层面的年度环境政策不确定性指数。该指数数值越大,表明环境政策不确定性越强。
若一篇新闻报道同时包含至少一个“环境”、“政策”和“不确定性”关键词,则认为此文章为目标文章。在关键词的筛选过程中,首先对研究使用的文本进行文本处理和词频分析,选择出现次数较多的词作为备选词集。接着,通过人工阅读并借鉴已有研究使用的词汇作为指数构建所需考虑的关键词(Baker等,2016)。具体如下:
首先,根据目标文章的定义,整理得到每份报纸每个月份的目标文章数量。为了避免不同报纸、不同月份文章总数差异所带来的影响,对每份报纸每个月的目标文章数进行规模化处理。 其次,对X进行正态化处理。 然后,得到中国不同层面的月度频率的环境政策不确定性指数。采用算术平均法,我们可以计算得到中国城市层面的年度环境政策不确定性指数。该指数数值越大,表明环境政策不确定性越强。 最后,按照报纸刊发地将460份报纸归类到31个省、市和自治区的267个地级市,依次按照前三个步骤进行计算,最终得到地级市层面的环境政策不确定性指数。
数据已进行标准化处理,各地级市之间的数据可比,也可考察数据的动态变化。
数据来源权威、可靠、详实,并由中国经济研究资料室精心整理。
|