In [43]:
import pandas as pd
import os
import jieba
import codecs
from gensim.models.ldamodel import LdaModel
from gensim.corpora import Dictionary
from gensim import corpora,models
import math
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer
from sklearn.decomposition import NMF, LatentDirichletAllocation
from gensim.models.coherencemodel import CoherenceModel
import random
from time import time
from tqdm import *
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import random
from math import log
import Levenshtein
import re
random.seed(0)
np.random.seed(0)
In [26]:
# 整理数据集
title = []
name_type = []
year = []
content = []
key_word = []
list_dir = os.listdir(‘data/补充后数据/会议按年分类’)
for i in list_dir:
data = pd.read_excel(‘data/补充后数据/会议按年分类/’ + i)
for value,j in enumerate(data[‘摘要’]):
name_type.append(‘会议’)
content.append(j)
year.append(int(i.split(‘.’)[0]))
title.append(list(data[‘题名’])[value])
key_word.append(list(data[‘关键词’])[value])
list_dir = os.listdir(‘data/补充后数据/报纸按年分类’)
for i in list_dir:
data = pd.read_excel(‘data/补充后数据/报纸按年分类/’ + i)
for value,j in enumerate(data[‘Summary-摘要’]):
name_type.append(‘报纸’)
content.append(j)
year.append(int(i.split(‘.’)[0]))
title.append(list(data[‘Title-题名’])[value])
key_word.append(list(data[‘Keyword-关键词’])[value])
list_dir = os.listdir(‘data/补充后数据/期刊按年分类’)
for i in list_dir:
data = pd.read_excel(‘data/补充后数据/期刊按年分类/’ + i)
for value,j in enumerate(data[‘摘要’]):
name_type.append(‘期刊’)
content.append(j)
year.append(int(i.split(‘.’)[0]))
title.append(list(data[‘题名’])[value])
key_word.append(list(data[‘关键词’])[value])
list_dir = os.listdir(‘data/补充后数据/硕博按年分类’)
for i in list_dir:
data = pd.read_excel(‘data/补充后数据/硕博按年分类/’ + i)
for value,j in enumerate(data[‘摘要’]):
name_type.append(‘硕博’)
content.append(j)
year.append(int(i.split(‘.’)[0]))
title.append(list(data[‘题名’])[value])
key_word.append(list(data[‘关键词’])[value])
data = pd.DataFrame()
data[‘title’] = title
data[‘name_type’] = name_type
data[‘key_word’] = key_word
data[‘content’] = content
data[‘year’] = year
data.to_csv(‘data/content_all.csv’, index=False)
In [27]:
# 去掉没有摘要的数据
data = data.dropna(subset=[‘content’])
# 对数据分词去停用词
def split_word(text, stopwords):
word_list = jieba.cut(text)
start = True
result = ”
for word in word_list:
word = word.strip()
if word not in stopwords:
if start:
result = word
start = False
else:
result += ‘ ‘ + word
return result
stopwords = []
for line in codecs.open(‘data/stop.txt’, ‘r’, ‘utf-8’):
stopwords.append(line.split(‘\n’)[0])
data[‘content’] = data[‘content’].apply(lambda row:split_word(str(row), stopwords))
data = data.reset_index()
del data[‘index’]
data
Out[27]:
title
name_type
key_word
content
year
0
协同创新模式下结合区域特色高校开展创新创业教育的新探索——以辽宁省为例
会议
协同创新;;区域特色;;高校;;创新创业教育
我国 经济 发展 新 常态 高校 创新 创业 教育 教育 系统 服务 创新型 国家 建设 战…
2015
1
“一带一路”战略与高校针对性改革新思路
会议
“一带一路”;;国际化;;教育开放;;科技创新
一带 一路 战略 进一步 提 � 呶 夜 � 酝饪 � 潘 � 降闹 卮 笳 铰 怨瓜 � …
2015
2
“一带一路”战略对烟台地区国际商务人才需求的调查与分析
会议
一带一路;;烟台;;国际商务人才
烟台 一带 一路 经济 建设 发展 方针 独特 地理 资源优势 经济 发展 新 增长点 烟台…
2016
3
“一带一路”战略视域下《中医基础理论》课程对俄教学话语体系的构建
会议
中医药;;”一带一路”战略;;中医基础理论;;对俄教学;;话语体系
一带 一路 国家 战略 如火如荼 背景 中医药 对外 传播 前所未有 机遇 中医药 发展 迎…
2016
4
在供给侧改革的背景下我国高校国际化策略
会议
高等教育供给侧改革;;高等教育国际化;;跨国教育输出
我国 高等教育 经历 十几年 快速增长 步入 转型 发展 时期 国家 经济 发展 供给 侧 …
2016
5
探析高等教育物流教学的专业体系创新构建——基于中国“一带一路”发展背景的思考
会议
一带一路;;物流教学;;专业体系;;创新构建
本文 中国 物流 产业 一带 一路 发展 背景 将会 引致 经济 发展趋势 分析 高等教育 …
2016
6
旗帜、基地、摇篮:“一带一路”战略中的张家港高等教育使命研究——基于江苏科技大学的发展与定位
会议
“一带一路”战略;;张家港高等教育;;使命
张家港 高等教育 一带 一路 战略 中应 三重 使命 演 三重 角色 集聚 高层次 人才 旗…
2016
7
“一带一路”视域下陕西高校外语教师面临的职业挑战与对策研究
会议
一带一路;;陕西;;高校外语教师;;职业发展
我国 一带 一路 战略部署 背景 陕西 建设 丝绸之路 经济带 新起点 社会 经济 发展 精…
2016
8
一带一路背景下陕西高校发展战略研究——基于SWOT分析法
会议
陕西高校;;发展战略;;SWOT
一带 一路 建设 陕西 高校 发展 提供 新 机遇 研究 一带 一路 背景 陕西 高校 发展…
2016
9
“一带一路”战略对烟台地区国际商务人才需求的调查与分析
会议
一带一路;;烟台;;国际商务人才
烟台 一带 一路 经济 建设 发展 方针 独特 地理 资源优势 经济 发展 新 增长点 烟台…
2017
10
“一带一路”战略视域下《中医基础理论》课程对俄教学话语体系的构建
会议
中医药;;”一带一路”战略;;中医基础理论;;对俄教学;;话语体系
一带 一路 国家 战略 如火如荼 背景 中医药 对外 传播 前所未有 机遇 中医药 发展 迎…
2017
11
在供给侧改革的背景下我国高校国际化策略
会议
高等教育供给侧改革;;高等教育国际化;;跨国教育输出
我国 高等教育 经历 十几年 快速增长 步入 转型 发展 时期 国家 经济 发展 供给 侧 …
2017
12
探析高等教育物流教学的专业体系创新构建——基于中国“一带一路”发展背景的思考
会议
一带一路;;物流教学;;专业体系;;创新构建
本文 中国 物流 产业 一带 一路 发展 背景 将会 引致 经济 发展趋势 分析 高等教育 …
2017
13
旗帜、基地、摇篮:“一带一路”战略中的张家港高等教育使命研究——基于江苏科技大学的发展与定位
会议
“一带一路”战略;;张家港高等教育;;使命
张家港 高等教育 一带 一路 战略 中应 三重 使命 演 三重 角色 集聚 高层次 人才 旗…
2017
14
“一带一路”视域下陕西高校外语教师面临的职业挑战与对策研究
会议
一带一路;;陕西;;高校外语教师;;职业发展
我国 一带 一路 战略部署 背景 陕西 建设 丝绸之路 经济带 新起点 社会 经济 发展 精…
2017
15
一带一路背景下陕西高校发展战略研究——基于SWOT分析法
会议
陕西高校;;发展战略;;SWOT
一带 一路 建设 陕西 高校 发展 提供 新 机遇 研究 一带 一路 背景 陕西 高校 发展…
2017
16
2018年研究生报考人数达238万 十九大报告成考题热点
会议
研究生;中国特色社会主义;习近平;人类命运共同体;招生单位;一带一路;
2017 年 12 月 25 日 上午 参加 全国 硕士 研究生 考试 考生 走进 中国人民…
2018
17
“一带一路”背景下高校翻译专业学生跨文化交际能力现状与培养策略
会议
“一带一路”;;翻译专业;;跨文化交际能力;;培养策略
一带 一路 战略 全面铺开 高校 翻译 专业 学生 跨文化 交际 能力 提出 新 高 肩负 …
2018
18
“一带一路”战略下重庆高校教育外宣发展状况研究——以重庆师范大学为例
会议
重庆师范大学;;孔子学院;;海外交流;;发展现状;;发展建议
国家 一带 一路 战略 引导 全国 教育 外宣 工作 发展 弊端 显露 本文 调查 研究 前…
2018
19
“一带一路”与云南高等教育发展的战略选择
期刊
“一带一路”战略;云南省高等教育;战略选择
一带 一路 国际 合作 发展 理念 倡议 云南 发挥 独特 区位 优势 拓展 外向型 发展 …
2014
20
我校成立丝绸之路教科文研究院(中心)
期刊
移动教育;远程教育;亿人;
本刊 讯 月 10 日 我校 推进 丝绸之路 智能 远程教育 基础 进一步 拓展 成立 丝绸…
2014
21
高校教学管理队伍建设研究
期刊
教学管理队伍;人才计划;老工业基地;长吉;现代化建设;教学质量;人才培养;专业结构;教学改革…
国家 实施 一带 一路 新一轮 东北 工业 基地 振兴 战略 契机 坚定不移 推进 长吉图 …
2015
22
CAFTA背景下广西发展高等教育服务贸易的环境因素及发展策略
期刊
CAFTA;广西高等教育服务贸易;环境因素;发展策略
中国 东盟自由贸易区 建成 特别 中国政府 中国 东盟 教育 交流 周 一带 一路 发展 战…
2015
23
中国“一带一路”建设与东南亚、南亚在华留学生的关联研究
期刊
“一带一路”东南亚;南亚在华留学生
中国 一带 一路 宏伟 战略 涉及 多个 国家 东南亚 南亚 国家 战略 重要一环 东南亚 …
2015
24
海归人才与高校师资国际化现状——以陕西省10所高校中留学生师资的调研数据为样本
期刊
陕西高校;西部地区;师资国际化;留学教育;“一带一路”人才
本文 西安交通大学 陕西 10 层次 高校 中 留学生 师资 调研 样本 数据 采集 分析 …
2015
25
推动中蒙合作办学服务“一带一路”国家战略
期刊
经贸合作;一带一路;合作办学;协同创新
内蒙古 我国 向北 开放 桥头堡 中蒙 经贸合作 草原 丝绸之路 经济带 构建 中 承担 国…
2015
26
西安市向周边国家出口高等教育服务的优势分析
期刊
高等教育服务;境外消费;向西部;留学生教育;留学生数量;外国留学生;枢纽城市;国际合作办学;…
加快 实施 一带 一路 战略 发展 背景 西安市 中国 西部 开放 枢纽 城市 高等教育 服…
2015
27
中亚留学生情感教育实践研究
期刊
情感教育;教育学原理;教育哲学;教育实践;中亚留学生
来华 留学生 教育 中国 文化 国际 传播 能力 建构 中外 交流 合作 民意 社会 基础 …
2015
28
就业动态
期刊
文理学科;遗产传承;文化战略;国家战略需求;发展战略;实习岗位;青年志愿者;志愿服务工作;职…
浙江大学 学科 优势 发挥 文化 传承 大学 职能 助力 国家 一带 一路 发展 战略 搭建…
2015
29
东南亚美术在广西高校美术史教学中的重要意义
期刊
东南亚;美术史;广西;教学;交流
现行 美术史 教材 东南亚 美术 介绍 篇幅 少 广西 地区 美术专业 学生 远远不够 南宁…
2015
…
…
…
…
…
…
1174
我国西部地区普通高等教育投资效率研究
硕博
西部地区;普通高等教育;教育投资效率;影响因素
经济 发展 科技 产业结构 升级 教育 需求 增多 教育资源 稀缺性 教育 投入产出 效率 …
2015
1175
中国高等教育投入产出的空间组织研究
硕博
资源配置;空间组织;投入产出;生产率;协调度
高等教育 投入产出 空间组织 指 教育资源 分布 结构 优化 配置 情况 空间组织 静态 意…
2015
1176
港湾学院航海类毕业生就业问题研究
硕博
港湾学院;;航海类毕业生;;就业;;职业素养
经济 全球化 快速 推进 全球 资源配置 商品流通 量 增加 海上 货物运输 占 跨国 运输…
2016
1177
教育国际化背景下云南留学教育服务质量研究
硕博
东南亚留学生;;南亚留学生;;满意度;;留学收获;;教育服务质量
经济 全球化 发展 教育 国际化 得以 推广 发展 一带 一路 战略 发展 云南 天然 独特…
2016
1178
研究型大学在包容性创新中的角色定位与实践路径研究
硕博
包容性创新;;大学包容性创新;;区域创新系统;;大学参与
研究 国内外 大学 包容性 创新 现实 情境 文献 分析 探索性 案例 研究 方法 文献 材…
2016
1179
中国研究生教育国际化发展的动因与路径研究
硕博
研究生教育;;国际化;;动因;;路径
研究生 教育 国民教育 序列 顶端 肩负着 高端 人才 供给 科学技术 创新 双重 使命 肩…
2016
1180
“一带一路”国家来华留学生文化距离、文化适应策略和文化适应的关系研究
硕博
一带一路;;留学生;;文化适应;;文化适应策略;;文化距离
目的 丝绸之路 经济带 海上 丝绸之路 简称 一带 一路 提出 一带 一路 国家 之间 经济…
2016
1181
中外合作办学质量影响因素分析
硕博
中外合作办学;管理机制;质量监控体系;规范管理
中外合作 办学 我国 高等教育 组成部分 历经 三十年 历史 发展 积累 办学 经验 伴随 …
2016
1182
“一带一路”国家来华留学生文化距离、文化适应策略和文化适应的关系研究
硕博
一带一路;留学生;文化适应;文化适应策略;文化距离
目的 丝绸之路 经济带 海上 丝绸之路 简称 一带 一路 提出 一带 一路 国家 之间 经济…
2016
1183
影视文化对南疆地区大学生思想政治教育的影响研究
硕博
影视文化;南疆地区;大学生;思想政治教育
影视文化 人类 社会 历史 发展 过程 中 产物 改革开放 开放 多元 文化 发展 背景 影…
2016
1184
新疆与其它少数民族省区高等教育发展状况的比较研究
硕博
新疆;普通高等教育;比较研究;发展状况
国家 一带 一路 战略 实施 新疆 繁荣 发展 面对 新 机遇 挑战 高等教育 教育 系统 …
2016
1185
甘肃省来华研究生教育现状调查研究
硕博
甘肃省;来华研究生;教育现状;对策
一带 一路 战略 影响 新兴 热门 留学 目的 国 中国 迎来 丝绸之路 沿线 国家 留学生…
2016
1186
甘肃省普通高等学校师资队伍建设现状、问题与对策研究
硕博
甘肃省;普通高等学校;师资队伍建设;问题;对策
甘肃省 中长期 教育 改革 发展 规划 纲要 2010 2020 甘肃省 十二五 高等教育 …
2016
1187
地方新建本科高校向应用型高校转型发展研究
硕博
地方新建本科高校;应用型高校;转型发展
产业结构 经济 结构 优化 调整 我国 处于 粗放型 集约型 经济 增长 模式 关键期 经济…
2016
1188
船舶工业高层次人才校企合作培养机制研究
硕博
校企合作培养机制;自组织系统;船舶工业;高层次人才
国际 船舶 市场需求 结构 发生 变化 我国 船舶工业 形势严峻 行业 经济效益 下滑 海洋…
2016
1189
教育国际化背景下云南留学教育服务质量研究
硕博
东南亚留学生;南亚留学生;满意度;留学收获;教育服务质量
经济 全球化 发展 教育 国际化 得以 推广 发展 一带 一路 战略 发展 云南 天然 独特…
2016
1190
南疆少数民族高校毕业生就业状况研究
硕博
就业现状;就业期望;就业前景;少数民族高校毕业生
新疆维吾尔自治区 我国 陆地 面积 边疆 省份 肩负着 保卫国家 主权 领土完整 重要职责 …
2016
1191
四川省大学国际化发展问题研究
硕博
大学国际化;四川省大学国际化发展;大学国际化水平排名
经济 全球化 发展 大学 国际化 发展 阻挡 趋势 大学 国际化 大学 第四 职能 我国 改…
2016
1192
安徽大学国际合作与交流存在的问题及对策研究
硕博
安徽大学;国际合作与交流;一流学科;国际化
中共中央办公厅 国务院办公厅 印发 做好 新 时期 教育 对外开放 工作 若干意见 简称 简…
2016
1193
高等职业教育校企合作研究
硕博
高等职业教育;校企合作;对策
中国 制造 2025 大众 创业 万众 创新 一带 一路 国家 战略 背景 推行 高等职业 …
2016
1194
“一带一路”战略下民族地区高校涉外护理专业课程体系的探究
硕博
“一带一路”战略;;民族地区高校;;涉外护理专业;;课程体系
目的 调查 国内 涉外 护理 教育 现状 基础 分析 国内 护理 教育 借鉴 国内 办学 经…
2017
1195
大学生对十八大以来党和国家重大政策的认同研究
硕博
大学生;;十八大;;政策;;政策认同
十八 党和国家 实施 一系列 政策 习近平 同志 核心 党中央 治国 理政 思想 集中体现 …
2017
1196
M大学发展战略研究
硕博
M大学;;发展战略;;SWOT分析;;高等院校
高等教育 服务 市场 竞争 越来越 激烈 有限 资源 高等院校 约束 发展 西方 战略 理论…
2017
1197
旅游管理专业本科毕业生就业状况分析与对策研究
硕博
旅游管理专业;;本科毕业生;;就业;;对策研究
我国 旅游业 蓬勃发展 旅游 产业 产业 融合 规模 不断扩大 旅游 人才需求 数量 质量 …
2017
1198
“一带一路”沿线国家在华留学生跨文化适应研究
硕博
留学生;;跨文化适应;;影响因素
全球化 速度 加快 中国 经济 飞速发展 我国 留学 规模 持续 出国 留学 来华 留学 人…
2017
1199
中亚五国孔子学院建设现状及问题分析
硕博
孔子学院;;中亚五国;;软实力;;“一带一路”建设
孔子 学院 中国 文化 对外 传播 重大项目 孔子 学院 中外合作 共建 方式 建立 文化 …
2017
1200
海丝文化融入高校思想政治教育的可行性路径探究
硕博
海丝文化;;思想政治教育;;路径
世界 格局 秩序 调整 引发 矛盾 冲突 中国 世界 经济体 因素 引发 世界 权力 转移 …
2017
1201
欧洲“博洛尼亚进程”的新进展研究(2010-2015)
硕博
博洛尼亚进程;;欧洲高等教育一体化
博洛尼亚 进程 目标 欧洲 领域 建立 更具 竞争性 兼容性 一体化 欧洲 高等教育 区 欧…
2017
1202
“一带一路”战略视域下地方本科院校人才培养模式研究
硕博
一带一路;;地方院校;;人才培养模式
2013 年 国家 提出 丝绸之路 经济带 21 世纪 丝绸之路 二者 简称 一带 一路 战…
2017
1203
“一带一路”视域下辽宁来华留学教育研究
硕博
“一带一路”;;辽宁来华留学教育;;现状;;问题;;对策
一带 一路 战略 新 时期 国家 高层 中国 世界 发展 新 背景 提出 战略 顺利 实施 …
2017
1204 rows × 5 columns
In [28]:
# 以coherence为评价指标,此指标越高结果越好,主题数越多运行速度也就越慢
data[‘text’] = data.apply(lambda row: row[‘content’].split(‘ ‘), axis=1)
dictionary = corpora.Dictionary(data[‘text’])
corpus = [dictionary.doc2bow(text) for text in data[‘text’]]
corpus_tfidf = models.TfidfModel(corpus)[corpus]
record_pos = []
record_value = []
for i in tqdm(range(5, 200, 5)):
record_pos.append(i)
lda = models.LdaModel(corpus_tfidf, num_topics=i, id2word=dictionary,
alpha=’auto’, eta=’auto’,minimum_probability=0, random_state=0)
goodcm = CoherenceModel(model=lda, texts=data[‘text’], dictionary=dictionary, coherence=’c_v’)
record_value.append(goodcm.get_coherence())
100%|██████████████████████████████████████████████████████████████████████████████████| 39/39 [14:53<00:00, 44.60s/it]
In [16]:
# 绘制不同主题数与coherence为值的图
plt.figure(figsize=(30,8), dpi=240)
plt.plot(record_pos, record_value, '#007A99')
plt.xticks(record_pos)
plt.ylabel('Coherence')
plt.show()
plt.savefig('lda_topic_Coherence.png', bbox_inches='tight', pad_inches=0.1)
# 最优数目
best_num = record_pos[np.argmax(record_value)]
print('最优主题数',best_num)

最优主题数 85
In [29]:
# 存储所得到的每个主题分布的概率结果并且与原表合并
lda = models.LdaModel(corpus_tfidf, num_topics=best_num, id2word=dictionary,
alpha=’auto’, eta=’auto’,minimum_probability=0, random_state=0)
doc_lda = lda[corpus_tfidf]
temp_array = []
for i in doc_lda:
temp = []
for j in i:
temp.append(j[1])
temp_array.append(temp)
prob = pd.DataFrame(temp_array)
new_column = []
for i in prob.columns:
new_column.append(‘topic_’ + str(i))
prob.columns = new_column
new_data = pd.concat([data, prob], axis=1)
new_data
Out[29]:
title
name_type
key_word
content
year
text
topic_0
topic_1
topic_2
topic_3
…
topic_75
topic_76
topic_77
topic_78
topic_79
topic_80
topic_81
topic_82
topic_83
topic_84
0
协同创新模式下结合区域特色高校开展创新创业教育的新探索——以辽宁省为例
会议
协同创新;;区域特色;;高校;;创新创业教育
我国 经济 发展 新 常态 高校 创新 创业 教育 教育 系统 服务 创新型 国家 建设 战…
2015
[我国, 经济, 发展, 新, 常态, 高校, 创新, 创业, 教育, 教育, 系统, 服务…
0.001883
0.001875
0.001898
0.001894
…
0.001870
0.001875
0.001875
0.001872
0.001868
0.001881
0.001886
0.001873
0.001873
0.001868
1
“一带一路”战略与高校针对性改革新思路
会议
“一带一路”;;国际化;;教育开放;;科技创新
一带 一路 战略 进一步 提 � 呶 夜 � 酝饪 � 潘 � 降闹 卮 笳 铰 怨瓜 � …
2015
[一带, 一路, 战略, 进一步, 提, �, 呶, 夜, �, 酝饪, �, 潘, �, …
0.001767
0.001759
0.037944
0.001777
…
0.001755
0.001759
0.001759
0.001756
0.001753
0.001765
0.001770
0.001758
0.001758
0.001753
2
“一带一路”战略对烟台地区国际商务人才需求的调查与分析
会议
一带一路;;烟台;;国际商务人才
烟台 一带 一路 经济 建设 发展 方针 独特 地理 资源优势 经济 发展 新 增长点 烟台…
2016
[烟台, 一带, 一路, 经济, 建设, 发展, 方针, 独特, 地理, 资源优势, 经济,…
0.002423
0.002413
0.002442
0.002438
…
0.002406
0.002413
0.002413
0.002408
0.002404
0.002421
0.002427
0.002410
0.002410
0.002404
3
“一带一路”战略视域下《中医基础理论》课程对俄教学话语体系的构建
会议
中医药;;”一带一路”战略;;中医基础理论;;对俄教学;;话语体系
一带 一路 国家 战略 如火如荼 背景 中医药 对外 传播 前所未有 机遇 中医药 发展 迎…
2016
[一带, 一路, 国家, 战略, 如火如荼, 背景, 中医药, 对外, 传播, 前所未有, …
0.001956
0.001948
0.836152
0.001968
…
0.001943
0.001948
0.001948
0.001944
0.001941
0.001955
0.001960
0.001946
0.001946
0.001941
4
在供给侧改革的背景下我国高校国际化策略
会议
高等教育供给侧改革;;高等教育国际化;;跨国教育输出
我国 高等教育 经历 十几年 快速增长 步入 转型 发展 时期 国家 经济 发展 供给 侧 …
2016
[我国, 高等教育, 经历, 十几年, 快速增长, 步入, 转型, 发展, 时期, 国家, …
0.002340
0.002330
0.002358
0.002354
…
0.002324
0.002330
0.002330
0.002326
0.002322
0.002338
0.002344
0.002328
0.002328
0.002322
5
探析高等教育物流教学的专业体系创新构建——基于中国“一带一路”发展背景的思考
会议
一带一路;;物流教学;;专业体系;;创新构建
本文 中国 物流 产业 一带 一路 发展 背景 将会 引致 经济 发展趋势 分析 高等教育 …
2016
[本文, 中国, 物流, 产业, 一带, 一路, 发展, 背景, 将会, 引致, 经济, 发…
0.001966
0.001958
0.001981
0.001978
…
0.001953
0.001958
0.001958
0.001954
0.001951
0.001965
0.001970
0.001956
0.001956
0.001951
6
旗帜、基地、摇篮:“一带一路”战略中的张家港高等教育使命研究——基于江苏科技大学的发展与定位
会议
“一带一路”战略;;张家港高等教育;;使命
张家港 高等教育 一带 一路 战略 中应 三重 使命 演 三重 角色 集聚 高层次 人才 旗…
2016
[张家港, 高等教育, 一带, 一路, 战略, 中应, 三重, 使命, 演, 三重, 角色,…
0.001985
0.001976
0.002000
0.001997
…
0.001971
0.001977
0.001977
0.001973
0.001970
0.001983
0.001988
0.001975
0.001975
0.001970
7
“一带一路”视域下陕西高校外语教师面临的职业挑战与对策研究
会议
一带一路;;陕西;;高校外语教师;;职业发展
我国 一带 一路 战略部署 背景 陕西 建设 丝绸之路 经济带 新起点 社会 经济 发展 精…
2016
[我国, 一带, 一路, 战略部署, 背景, 陕西, 建设, 丝绸之路, 经济带, 新起点,…
0.002108
0.002099
0.002124
0.002121
…
0.002094
0.002099
0.002099
0.002095
0.002092
0.002106
0.002112
0.002097
0.002097
0.002092
8
一带一路背景下陕西高校发展战略研究——基于SWOT分析法
会议
陕西高校;;发展战略;;SWOT
一带 一路 建设 陕西 高校 发展 提供 新 机遇 研究 一带 一路 背景 陕西 高校 发展…
2016
[一带, 一路, 建设, 陕西, 高校, 发展, 提供, 新, 机遇, 研究, 一带, 一路…
0.001834
0.001826
0.001848
0.001845
…
0.001822
0.001826
0.001826
0.001823
0.001820
0.001833
0.001837
0.001825
0.561129
0.001820
9
“一带一路”战略对烟台地区国际商务人才需求的调查与分析
会议
一带一路;;烟台;;国际商务人才
烟台 一带 一路 经济 建设 发展 方针 独特 地理 资源优势 经济 发展 新 增长点 烟台…
2017
[烟台, 一带, 一路, 经济, 建设, 发展, 方针, 独特, 地理, 资源优势, 经济,…
0.002423
0.002413
0.002442
0.002438
…
0.002406
0.002413
0.002413
0.002408
0.002404
0.002421
0.002427
0.002410
0.002410
0.002404
10
“一带一路”战略视域下《中医基础理论》课程对俄教学话语体系的构建
会议
中医药;;”一带一路”战略;;中医基础理论;;对俄教学;;话语体系
一带 一路 国家 战略 如火如荼 背景 中医药 对外 传播 前所未有 机遇 中医药 发展 迎…
2017
[一带, 一路, 国家, 战略, 如火如荼, 背景, 中医药, 对外, 传播, 前所未有, …
0.001956
0.001948
0.836152
0.001968
…
0.001943
0.001948
0.001948
0.001944
0.001941
0.001955
0.001960
0.001946
0.001946
0.001941
11
在供给侧改革的背景下我国高校国际化策略
会议
高等教育供给侧改革;;高等教育国际化;;跨国教育输出
我国 高等教育 经历 十几年 快速增长 步入 转型 发展 时期 国家 经济 发展 供给 侧 …
2017
[我国, 高等教育, 经历, 十几年, 快速增长, 步入, 转型, 发展, 时期, 国家, …
0.002340
0.002330
0.002358
0.002354
…
0.002324
0.002330
0.002330
0.002326
0.002322
0.002338
0.002344
0.002328
0.002328
0.002322
12
探析高等教育物流教学的专业体系创新构建——基于中国“一带一路”发展背景的思考
会议
一带一路;;物流教学;;专业体系;;创新构建
本文 中国 物流 产业 一带 一路 发展 背景 将会 引致 经济 发展趋势 分析 高等教育 …
2017
[本文, 中国, 物流, 产业, 一带, 一路, 发展, 背景, 将会, 引致, 经济, 发…
0.001966
0.001958
0.001981
0.001978
…
0.001953
0.001958
0.001958
0.001954
0.001951
0.001965
0.001970
0.001956
0.001956
0.001951
13
旗帜、基地、摇篮:“一带一路”战略中的张家港高等教育使命研究——基于江苏科技大学的发展与定位
会议
“一带一路”战略;;张家港高等教育;;使命
张家港 高等教育 一带 一路 战略 中应 三重 使命 演 三重 角色 集聚 高层次 人才 旗…
2017
[张家港, 高等教育, 一带, 一路, 战略, 中应, 三重, 使命, 演, 三重, 角色,…
0.001985
0.001976
0.002000
0.001997
…
0.001971
0.001977
0.001977
0.001973
0.001970
0.001983
0.001988
0.001975
0.001975
0.001970
14
“一带一路”视域下陕西高校外语教师面临的职业挑战与对策研究
会议
一带一路;;陕西;;高校外语教师;;职业发展
我国 一带 一路 战略部署 背景 陕西 建设 丝绸之路 经济带 新起点 社会 经济 发展 精…
2017
[我国, 一带, 一路, 战略部署, 背景, 陕西, 建设, 丝绸之路, 经济带, 新起点,…
0.002108
0.002099
0.002124
0.002121
…
0.002094
0.002099
0.002099
0.002095
0.002092
0.002106
0.002112
0.002097
0.002097
0.002092
15
一带一路背景下陕西高校发展战略研究——基于SWOT分析法
会议
陕西高校;;发展战略;;SWOT
一带 一路 建设 陕西 高校 发展 提供 新 机遇 研究 一带 一路 背景 陕西 高校 发展…
2017
[一带, 一路, 建设, 陕西, 高校, 发展, 提供, 新, 机遇, 研究, 一带, 一路…
0.001834
0.001826
0.001848
0.001845
…
0.001822
0.001826
0.001826
0.001823
0.001820
0.001833
0.001837
0.001825
0.561015
0.001820
16
2018年研究生报考人数达238万 十九大报告成考题热点
会议
研究生;中国特色社会主义;习近平;人类命运共同体;招生单位;一带一路;
2017 年 12 月 25 日 上午 参加 全国 硕士 研究生 考试 考生 走进 中国人民…
2018
[2017, 年, 12, 月, 25, 日, 上午, 参加, 全国, 硕士, 研究生, 考…
0.001568
0.001561
0.001580
0.001578
…
0.001557
0.026214
0.001561
0.001559
0.001556
0.001567
0.001571
0.001560
0.001560
0.001556
17
“一带一路”背景下高校翻译专业学生跨文化交际能力现状与培养策略
会议
“一带一路”;;翻译专业;;跨文化交际能力;;培养策略
一带 一路 战略 全面铺开 高校 翻译 专业 学生 跨文化 交际 能力 提出 新 高 肩负 …
2018
[一带, 一路, 战略, 全面铺开, 高校, 翻译, 专业, 学生, 跨文化, 交际, 能力…
0.001503
0.001497
0.227244
0.001512
…
0.001493
0.001497
0.001497
0.001494
0.001492
0.001502
0.030978
0.001496
0.001496
0.001492
18
“一带一路”战略下重庆高校教育外宣发展状况研究——以重庆师范大学为例
会议
重庆师范大学;;孔子学院;;海外交流;;发展现状;;发展建议
国家 一带 一路 战略 引导 全国 教育 外宣 工作 发展 弊端 显露 本文 调查 研究 前…
2018
[国家, 一带, 一路, 战略, 引导, 全国, 教育, 外宣, 工作, 发展, 弊端, 显…
0.001817
0.001809
0.001831
0.001828
…
0.001805
0.001809
0.001809
0.001806
0.001803
0.001816
0.001820
0.001808
0.001808
0.001803
19
“一带一路”与云南高等教育发展的战略选择
期刊
“一带一路”战略;云南省高等教育;战略选择
一带 一路 国际 合作 发展 理念 倡议 云南 发挥 独特 区位 优势 拓展 外向型 发展 …
2014
[一带, 一路, 国际, 合作, 发展, 理念, 倡议, 云南, 发挥, 独特, 区位, 优…
0.001528
0.001522
0.001540
0.001537
…
0.001518
0.001522
0.001522
0.001519
0.001516
0.001527
0.001531
0.001520
0.001520
0.001516
20
我校成立丝绸之路教科文研究院(中心)
期刊
移动教育;远程教育;亿人;
本刊 讯 月 10 日 我校 推进 丝绸之路 智能 远程教育 基础 进一步 拓展 成立 丝绸…
2014
[本刊, 讯, 月, 10, 日, 我校, 推进, 丝绸之路, 智能, 远程教育, 基础, …
0.001922
0.001913
0.001937
0.001933
…
0.001909
0.001914
0.001914
0.001910
0.001907
0.001920
0.001925
0.001912
0.001912
0.001907
21
高校教学管理队伍建设研究
期刊
教学管理队伍;人才计划;老工业基地;长吉;现代化建设;教学质量;人才培养;专业结构;教学改革…
国家 实施 一带 一路 新一轮 东北 工业 基地 振兴 战略 契机 坚定不移 推进 长吉图 …
2015
[国家, 实施, 一带, 一路, 新一轮, 东北, 工业, 基地, 振兴, 战略, 契机, …
0.001683
0.001675
0.859061
0.001693
…
0.001671
0.001676
0.001676
0.001673
0.001670
0.001681
0.001686
0.001674
0.001674
0.001670
22
CAFTA背景下广西发展高等教育服务贸易的环境因素及发展策略
期刊
CAFTA;广西高等教育服务贸易;环境因素;发展策略
中国 东盟自由贸易区 建成 特别 中国政府 中国 东盟 教育 交流 周 一带 一路 发展 战…
2015
[中国, 东盟自由贸易区, 建成, 特别, 中国政府, 中国, 东盟, 教育, 交流, 周,…
0.002016
0.002007
0.002032
0.002028
…
0.002002
0.002007
0.002007
0.002004
0.002000
0.002014
0.002020
0.002006
0.002006
0.002000
23
中国“一带一路”建设与东南亚、南亚在华留学生的关联研究
期刊
“一带一路”东南亚;南亚在华留学生
中国 一带 一路 宏伟 战略 涉及 多个 国家 东南亚 南亚 国家 战略 重要一环 东南亚 …
2015
[中国, 一带, 一路, 宏伟, 战略, 涉及, 多个, 国家, 东南亚, 南亚, 国家, …
0.002228
0.002218
0.002245
0.002241
…
0.002212
0.002218
0.002218
0.002214
0.002210
0.813406
0.002231
0.002216
0.002216
0.002210
24
海归人才与高校师资国际化现状——以陕西省10所高校中留学生师资的调研数据为样本
期刊
陕西高校;西部地区;师资国际化;留学教育;“一带一路”人才
本文 西安交通大学 陕西 10 层次 高校 中 留学生 师资 调研 样本 数据 采集 分析 …
2015
[本文, 西安交通大学, 陕西, 10, 层次, 高校, 中, 留学生, 师资, 调研, 样…
0.001305
0.001299
0.001315
0.001312
…
0.001296
0.001299
0.001299
0.001297
0.001295
0.001304
0.001307
0.001298
0.038296
0.001295
25
推动中蒙合作办学服务“一带一路”国家战略
期刊
经贸合作;一带一路;合作办学;协同创新
内蒙古 我国 向北 开放 桥头堡 中蒙 经贸合作 草原 丝绸之路 经济带 构建 中 承担 国…
2015
[内蒙古, 我国, 向北, 开放, 桥头堡, 中蒙, 经贸合作, 草原, 丝绸之路, 经济带…
0.001962
0.001954
0.001977
0.001974
…
0.001949
0.001954
0.001954
0.001950
0.001947
0.001961
0.001966
0.001952
0.001952
0.001947
26
西安市向周边国家出口高等教育服务的优势分析
期刊
高等教育服务;境外消费;向西部;留学生教育;留学生数量;外国留学生;枢纽城市;国际合作办学;…
加快 实施 一带 一路 战略 发展 背景 西安市 中国 西部 开放 枢纽 城市 高等教育 服…
2015
[加快, 实施, 一带, 一路, 战略, 发展, 背景, 西安市, 中国, 西部, 开放, …
0.002667
0.002656
0.002688
0.002684
…
0.002649
0.002656
0.002656
0.002651
0.002647
0.002665
0.122673
0.002654
0.002654
0.002647
27
中亚留学生情感教育实践研究
期刊
情感教育;教育学原理;教育哲学;教育实践;中亚留学生
来华 留学生 教育 中国 文化 国际 传播 能力 建构 中外 交流 合作 民意 社会 基础 …
2015
[来华, 留学生, 教育, 中国, 文化, 国际, 传播, 能力, 建构, 中外, 交流, …
0.001540
0.001533
0.001552
0.001549
…
0.001529
0.001533
0.001533
0.001531
0.001528
0.001539
0.001543
0.001532
0.001532
0.001528
28
就业动态
期刊
文理学科;遗产传承;文化战略;国家战略需求;发展战略;实习岗位;青年志愿者;志愿服务工作;职…
浙江大学 学科 优势 发挥 文化 传承 大学 职能 助力 国家 一带 一路 发展 战略 搭建…
2015
[浙江大学, 学科, 优势, 发挥, 文化, 传承, 大学, 职能, 助力, 国家, 一带,…
0.001915
0.001906
0.001930
0.001926
…
0.001902
0.001907
0.001907
0.001903
0.001900
0.001913
0.001918
0.001905
0.001905
0.001900
29
东南亚美术在广西高校美术史教学中的重要意义
期刊
东南亚;美术史;广西;教学;交流
现行 美术史 教材 东南亚 美术 介绍 篇幅 少 广西 地区 美术专业 学生 远远不够 南宁…
2015
[现行, 美术史, 教材, 东南亚, 美术, 介绍, 篇幅, 少, 广西, 地区, 美术专业…
0.001764
0.001757
0.001778
0.001775
…
0.001752
0.001757
0.001757
0.001754
0.001751
0.001763
0.001767
0.001755
0.001755
0.001751
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
1174
我国西部地区普通高等教育投资效率研究
硕博
西部地区;普通高等教育;教育投资效率;影响因素
经济 发展 科技 产业结构 升级 教育 需求 增多 教育资源 稀缺性 教育 投入产出 效率 …
2015
[经济, 发展, 科技, 产业结构, 升级, 教育, 需求, 增多, 教育资源, 稀缺性, …
0.001627
0.001620
0.001640
0.001637
…
0.019321
0.001621
0.001621
0.001618
0.001615
0.118258
0.001630
0.001619
0.001619
0.001615
1175
中国高等教育投入产出的空间组织研究
硕博
资源配置;空间组织;投入产出;生产率;协调度
高等教育 投入产出 空间组织 指 教育资源 分布 结构 优化 配置 情况 空间组织 静态 意…
2015
[高等教育, 投入产出, 空间组织, 指, 教育资源, 分布, 结构, 优化, 配置, 情况…
0.001090
0.001086
0.005519
0.024947
…
0.001083
0.025804
0.001086
0.001084
0.001082
0.575079
0.001092
0.001085
0.001085
0.001082
1176
港湾学院航海类毕业生就业问题研究
硕博
港湾学院;;航海类毕业生;;就业;;职业素养
经济 全球化 快速 推进 全球 资源配置 商品流通 量 增加 海上 货物运输 占 跨国 运输…
2016
[经济, 全球化, 快速, 推进, 全球, 资源配置, 商品流通, 量, 增加, 海上, 货…
0.001337
0.001331
0.001347
0.104289
…
0.001328
0.001331
0.001331
0.001329
0.001327
0.611307
0.001339
0.001330
0.001330
0.001327
1177
教育国际化背景下云南留学教育服务质量研究
硕博
东南亚留学生;;南亚留学生;;满意度;;留学收获;;教育服务质量
经济 全球化 发展 教育 国际化 得以 推广 发展 一带 一路 战略 发展 云南 天然 独特…
2016
[经济, 全球化, 发展, 教育, 国际化, 得以, 推广, 发展, 一带, 一路, 战略,…
0.022687
0.001716
0.001737
0.001734
…
0.001712
0.001716
0.001716
0.001713
0.001710
0.001722
0.001726
0.001714
0.001715
0.001710
1178
研究型大学在包容性创新中的角色定位与实践路径研究
硕博
包容性创新;;大学包容性创新;;区域创新系统;;大学参与
研究 国内外 大学 包容性 创新 现实 情境 文献 分析 探索性 案例 研究 方法 文献 材…
2016
[研究, 国内外, 大学, 包容性, 创新, 现实, 情境, 文献, 分析, 探索性, 案例…
0.088521
0.001743
0.087505
0.001761
…
0.001738
0.001743
0.001743
0.001740
0.001737
0.001749
0.001753
0.680874
0.001741
0.001737
1179
中国研究生教育国际化发展的动因与路径研究
硕博
研究生教育;;国际化;;动因;;路径
研究生 教育 国民教育 序列 顶端 肩负着 高端 人才 供给 科学技术 创新 双重 使命 肩…
2016
[研究生, 教育, 国民教育, 序列, 顶端, 肩负着, 高端, 人才, 供给, 科学技术,…
0.001542
0.001535
0.001554
0.001551
…
0.001531
0.001535
0.001535
0.001533
0.001530
0.001541
0.001545
0.001534
0.001534
0.001530
1180
“一带一路”国家来华留学生文化距离、文化适应策略和文化适应的关系研究
硕博
一带一路;;留学生;;文化适应;;文化适应策略;;文化距离
目的 丝绸之路 经济带 海上 丝绸之路 简称 一带 一路 提出 一带 一路 国家 之间 经济…
2016
[目的, 丝绸之路, 经济带, 海上, 丝绸之路, 简称, 一带, 一路, 提出, 一带, …
0.001507
0.001500
0.121921
0.001516
…
0.001496
0.001500
0.001500
0.001498
0.001495
0.001505
0.048581
0.001499
0.001499
0.001495
1181
中外合作办学质量影响因素分析
硕博
中外合作办学;管理机制;质量监控体系;规范管理
中外合作 办学 我国 高等教育 组成部分 历经 三十年 历史 发展 积累 办学 经验 伴随 …
2016
[中外合作, 办学, 我国, 高等教育, 组成部分, 历经, 三十年, 历史, 发展, 积累…
0.001281
0.001275
0.001291
0.001289
…
0.001272
0.001275
0.001275
0.001273
0.001271
0.001280
0.001283
0.001274
0.056180
0.001271
1182
“一带一路”国家来华留学生文化距离、文化适应策略和文化适应的关系研究
硕博
一带一路;留学生;文化适应;文化适应策略;文化距离
目的 丝绸之路 经济带 海上 丝绸之路 简称 一带 一路 提出 一带 一路 国家 之间 经济…
2016
[目的, 丝绸之路, 经济带, 海上, 丝绸之路, 简称, 一带, 一路, 提出, 一带, …
0.001507
0.001500
0.123574
0.001516
…
0.001496
0.001500
0.001500
0.001498
0.001495
0.001505
0.048022
0.001499
0.001499
0.001495
1183
影视文化对南疆地区大学生思想政治教育的影响研究
硕博
影视文化;南疆地区;大学生;思想政治教育
影视文化 人类 社会 历史 发展 过程 中 产物 改革开放 开放 多元 文化 发展 背景 影…
2016
[影视文化, 人类, 社会, 历史, 发展, 过程, 中, 产物, 改革开放, 开放, 多元…
0.001612
0.001605
0.124293
0.113667
…
0.001601
0.001605
0.001605
0.001602
0.001599
0.001611
0.012998
0.001604
0.001604
0.001599
1184
新疆与其它少数民族省区高等教育发展状况的比较研究
硕博
新疆;普通高等教育;比较研究;发展状况
国家 一带 一路 战略 实施 新疆 繁荣 发展 面对 新 机遇 挑战 高等教育 教育 系统 …
2016
[国家, 一带, 一路, 战略, 实施, 新疆, 繁荣, 发展, 面对, 新, 机遇, 挑战…
0.001493
0.001487
0.001505
0.070399
…
0.001483
0.001487
0.001487
0.001484
0.001481
0.001492
0.001496
0.001485
0.001485
0.001481
1185
甘肃省来华研究生教育现状调查研究
硕博
甘肃省;来华研究生;教育现状;对策
一带 一路 战略 影响 新兴 热门 留学 目的 国 中国 迎来 丝绸之路 沿线 国家 留学生…
2016
[一带, 一路, 战略, 影响, 新兴, 热门, 留学, 目的, 国, 中国, 迎来, 丝绸…
0.001258
0.001253
0.001268
0.121151
…
0.001250
0.001253
0.001253
0.001251
0.001249
0.001257
0.106933
0.001252
0.001252
0.001249
1186
甘肃省普通高等学校师资队伍建设现状、问题与对策研究
硕博
甘肃省;普通高等学校;师资队伍建设;问题;对策
甘肃省 中长期 教育 改革 发展 规划 纲要 2010 2020 甘肃省 十二五 高等教育 …
2016
[甘肃省, 中长期, 教育, 改革, 发展, 规划, 纲要, 2010, 2020, 甘肃省…
0.001354
0.001349
0.101504
0.001363
…
0.001345
0.001349
0.001349
0.001346
0.001344
0.001353
0.001357
0.001347
0.001347
0.001344
1187
地方新建本科高校向应用型高校转型发展研究
硕博
地方新建本科高校;应用型高校;转型发展
产业结构 经济 结构 优化 调整 我国 处于 粗放型 集约型 经济 增长 模式 关键期 经济…
2016
[产业结构, 经济, 结构, 优化, 调整, 我国, 处于, 粗放型, 集约型, 经济, 增…
0.001364
0.001358
0.001375
0.142566
…
0.001355
0.001359
0.001359
0.001356
0.001354
0.001363
0.001367
0.001357
0.001357
0.001354
1188
船舶工业高层次人才校企合作培养机制研究
硕博
校企合作培养机制;自组织系统;船舶工业;高层次人才
国际 船舶 市场需求 结构 发生 变化 我国 船舶工业 形势严峻 行业 经济效益 下滑 海洋…
2016
[国际, 船舶, 市场需求, 结构, 发生, 变化, 我国, 船舶工业, 形势严峻, 行业,…
0.001444
0.001437
0.001455
0.001452
…
0.001434
0.001437
0.001437
0.001435
0.001432
0.001442
0.001446
0.001436
0.001436
0.001432
1189
教育国际化背景下云南留学教育服务质量研究
硕博
东南亚留学生;南亚留学生;满意度;留学收获;教育服务质量
经济 全球化 发展 教育 国际化 得以 推广 发展 一带 一路 战略 发展 云南 天然 独特…
2016
[经济, 全球化, 发展, 教育, 国际化, 得以, 推广, 发展, 一带, 一路, 战略,…
0.022669
0.001716
0.001737
0.001734
…
0.001712
0.001716
0.001716
0.001713
0.001710
0.001722
0.001726
0.001714
0.001715
0.001710
1190
南疆少数民族高校毕业生就业状况研究
硕博
就业现状;就业期望;就业前景;少数民族高校毕业生
新疆维吾尔自治区 我国 陆地 面积 边疆 省份 肩负着 保卫国家 主权 领土完整 重要职责 …
2016
[新疆维吾尔自治区, 我国, 陆地, 面积, 边疆, 省份, 肩负着, 保卫国家, 主权, …
0.019440
0.001166
0.001180
0.001178
…
0.001163
0.001166
0.001166
0.001164
0.001162
0.001170
0.001173
0.001165
0.001165
0.001162
1191
四川省大学国际化发展问题研究
硕博
大学国际化;四川省大学国际化发展;大学国际化水平排名
经济 全球化 发展 大学 国际化 发展 阻挡 趋势 大学 国际化 大学 第四 职能 我国 改…
2016
[经济, 全球化, 发展, 大学, 国际化, 发展, 阻挡, 趋势, 大学, 国际化, 大学…
0.001120
0.042714
0.001129
0.094859
…
0.001113
0.005388
0.001116
0.001114
0.001112
0.001119
0.001122
0.001115
0.001115
0.001112
1192
安徽大学国际合作与交流存在的问题及对策研究
硕博
安徽大学;国际合作与交流;一流学科;国际化
中共中央办公厅 国务院办公厅 印发 做好 新 时期 教育 对外开放 工作 若干意见 简称 简…
2016
[中共中央办公厅, 国务院办公厅, 印发, 做好, 新, 时期, 教育, 对外开放, 工作,…
0.000828
0.000824
0.000834
0.108790
…
0.000822
0.096958
0.000824
0.000823
0.000821
0.000827
0.000829
0.000823
0.000823
0.000821
1193
高等职业教育校企合作研究
硕博
高等职业教育;校企合作;对策
中国 制造 2025 大众 创业 万众 创新 一带 一路 国家 战略 背景 推行 高等职业 …
2016
[中国, 制造, 2025, 大众, 创业, 万众, 创新, 一带, 一路, 国家, 战略,…
0.001439
0.001433
0.118269
0.110843
…
0.001429
0.001433
0.001433
0.001430
0.001428
0.001438
0.001441
0.001431
0.001431
0.001428
1194
“一带一路”战略下民族地区高校涉外护理专业课程体系的探究
硕博
“一带一路”战略;;民族地区高校;;涉外护理专业;;课程体系
目的 调查 国内 涉外 护理 教育 现状 基础 分析 国内 护理 教育 借鉴 国内 办学 经…
2017
[目的, 调查, 国内, 涉外, 护理, 教育, 现状, 基础, 分析, 国内, 护理, 教…
0.001212
0.001207
0.070621
0.025406
…
0.001204
0.001207
0.001207
0.001205
0.001203
0.038077
0.001214
0.001206
0.001206
0.001203
1195
大学生对十八大以来党和国家重大政策的认同研究
硕博
大学生;;十八大;;政策;;政策认同
十八 党和国家 实施 一系列 政策 习近平 同志 核心 党中央 治国 理政 思想 集中体现 …
2017
[十八, 党和国家, 实施, 一系列, 政策, 习近平, 同志, 核心, 党中央, 治国, …
0.001681
0.001673
0.045948
0.104389
…
0.001669
0.001673
0.001673
0.001670
0.001668
0.001679
0.001683
0.001672
0.001672
0.001668
1196
M大学发展战略研究
硕博
M大学;;发展战略;;SWOT分析;;高等院校
高等教育 服务 市场 竞争 越来越 激烈 有限 资源 高等院校 约束 发展 西方 战略 理论…
2017
[高等教育, 服务, 市场, 竞争, 越来越, 激烈, 有限, 资源, 高等院校, 约束, …
0.001406
0.001400
0.001417
0.001415
…
0.001396
0.001400
0.001400
0.001398
0.001395
0.001405
0.001409
0.001399
0.001399
0.001395
1197
旅游管理专业本科毕业生就业状况分析与对策研究
硕博
旅游管理专业;;本科毕业生;;就业;;对策研究
我国 旅游业 蓬勃发展 旅游 产业 产业 融合 规模 不断扩大 旅游 人才需求 数量 质量 …
2017
[我国, 旅游业, 蓬勃发展, 旅游, 产业, 产业, 融合, 规模, 不断扩大, 旅游, …
0.001656
0.001649
0.236822
0.001666
…
0.001644
0.001649
0.001649
0.001646
0.001643
0.001654
0.104204
0.001647
0.001647
0.001643
1198
“一带一路”沿线国家在华留学生跨文化适应研究
硕博
留学生;;跨文化适应;;影响因素
全球化 速度 加快 中国 经济 飞速发展 我国 留学 规模 持续 出国 留学 来华 留学 人…
2017
[全球化, 速度, 加快, 中国, 经济, 飞速发展, 我国, 留学, 规模, 持续, 出国…
0.000895
0.000891
0.100924
0.000900
…
0.000888
0.000891
0.000891
0.000889
0.000888
0.000894
0.057469
0.000890
0.000890
0.000888
1199
中亚五国孔子学院建设现状及问题分析
硕博
孔子学院;;中亚五国;;软实力;;“一带一路”建设
孔子 学院 中国 文化 对外 传播 重大项目 孔子 学院 中外合作 共建 方式 建立 文化 …
2017
[孔子, 学院, 中国, 文化, 对外, 传播, 重大项目, 孔子, 学院, 中外合作, 共…
0.001273
0.018947
0.001283
0.001281
…
0.001264
0.001268
0.001268
0.001265
0.001263
0.001272
0.090514
0.001266
0.001266
0.001263
1200
海丝文化融入高校思想政治教育的可行性路径探究
硕博
海丝文化;;思想政治教育;;路径
世界 格局 秩序 调整 引发 矛盾 冲突 中国 世界 经济体 因素 引发 世界 权力 转移 …
2017
[世界, 格局, 秩序, 调整, 引发, 矛盾, 冲突, 中国, 世界, 经济体, 因素, …
0.001354
0.001348
0.001364
0.075894
…
0.001344
0.001348
0.001348
0.001346
0.001343
0.001353
0.001356
0.001347
0.001347
0.001343
1201
欧洲“博洛尼亚进程”的新进展研究(2010-2015)
硕博
博洛尼亚进程;;欧洲高等教育一体化
博洛尼亚 进程 目标 欧洲 领域 建立 更具 竞争性 兼容性 一体化 欧洲 高等教育 区 欧…
2017
[博洛尼亚, 进程, 目标, 欧洲, 领域, 建立, 更具, 竞争性, 兼容性, 一体化, …
0.001247
0.001241
0.001257
0.001254
…
0.001238
0.001242
0.001242
0.001239
0.001237
0.070473
0.015144
0.001240
0.001240
0.001237
1202
“一带一路”战略视域下地方本科院校人才培养模式研究
硕博
一带一路;;地方院校;;人才培养模式
2013 年 国家 提出 丝绸之路 经济带 21 世纪 丝绸之路 二者 简称 一带 一路 战…
2017
[2013, 年, 国家, 提出, 丝绸之路, 经济带, 21, 世纪, 丝绸之路, 二者,…
0.001710
0.001703
0.001724
0.001721
…
0.001699
0.010476
0.001703
0.001700
0.001697
0.001709
0.001713
0.001702
0.009036
0.001697
1203
“一带一路”视域下辽宁来华留学教育研究
硕博
“一带一路”;;辽宁来华留学教育;;现状;;问题;;对策
一带 一路 战略 新 时期 国家 高层 中国 世界 发展 新 背景 提出 战略 顺利 实施 …
2017
[一带, 一路, 战略, 新, 时期, 国家, 高层, 中国, 世界, 发展, 新, 背景,…
0.001187
0.001182
0.082432
0.001195
…
0.001179
0.001182
0.001182
0.001180
0.001178
0.001186
0.001189
0.001181
0.001181
0.001178
1204 rows × 91 columns
In [18]:
# 根据公式计算主题强度
# 主题强度描述了主题在某个时间窗口上受关注的程度,即在某个时间窗口上包含某主题的文档数目越多,此主题的的强度越大
def get_strength(every_columns):
return float(np.sum(every_columns))/len(every_columns)
strength = new_data.groupby(‘year’).agg(get_strength).reset_index()
strength
# 绘制热度图
year_list = strength[‘year’]
del strength[‘year’]
topic = np.array(strength).T
fig, ax = plt.subplots(figsize = (17,17))
sns.heatmap(pd.DataFrame(topic, columns = year_list, index = new_column),
vmax=np.max(topic),vmin=np.min(topic), xticklabels= True, yticklabels= True, square=True, cmap=”Blues”)
ax.set_ylabel(‘topic’, fontsize = 10)
ax.set_xlabel(‘year’, fontsize = 10)
Out[18]:
Text(0.5,132,’year’)

In [30]:
### 选取前10个主题
### 这里会有一定随机性,但是大致差别不大,热门主题,因此我用表记录结果
if os.path.exists(‘data/lda_top_topic.csv’):
df_topic_top = pd.read_csv(‘data/lda_top_topic.csv’)
else:
topic_list = lda.print_topics(num_topics=10, num_words=10)
topic_name_list = []
topic_data_list = []
for i in topic_list:
topic_name_list.append(‘topic_’ + str(i[0]))
list_text = i[1].split(‘”‘)
new_text_list = []
for j,text_value in enumerate(list_text):
if ((j%2!=0)&(len(text_value)>1)):
new_text_list.append(text_value)
topic_data_list.append(‘,’.join(new_text_list))
df_topic_top = pd.DataFrame()
df_topic_top[‘topic_num’] = topic_name_list
df_topic_top[‘topic_data’] = topic_data_list
df_topic_top.to_csv(‘data/lda_top_topic.csv’, index=False)
df_topic_top
Out[30]:
topic_num
topic_data
0
topic_59
海洋,就业,创业,能力,新疆,物流,大学生,物流业,跨文化,工程技术
1
topic_27
医学,外语类,惯性,民办高校,博洛尼亚,中外合作,创业,经贸,突破
2
topic_11
民办高校,缅甸,翻译,跨文化,地方,分校,高等教育,国际化,境内,重庆
3
topic_46
课程,职业,土木工程,开发,广西,电子商务,会计,判断能力,示范
4
topic_34
艺术,巴基斯坦,税收,民族,外语,茶文化,大学生,第五,功能,大学
5
topic_25
合作,研究生,办学,铁路,国际化,途径,教育,课程,沿边,感觉
6
topic_37
少数民族,教育,教学,政治,校务,思想,大学生,国际,国际化,电商
7
topic_73
舞蹈,新疆,人才培养,中外合作,民办高校,办学,高校,国际,留学,辅导员
8
topic_38
高校,留学,留学生,知识,宁波,教育,来华,工程,工科
9
topic_3
对外开放,国际化,BIM,高等教育,办学,政策,中外合作,实施,教育
In [32]:
# 绘制活跃文献主题强度演化趋势图
topic_num_list = df_topic_top[‘topic_num’]
for i in topic_num_list:
plt.plot(year_list, strength[i], ‘-*’)
plt.xticks(year_list)
plt.legend(topic_num_list)
plt.show()

In [33]:
# 对每个时间窗口内的文本集合使用 LDA 模型进行训练,提取出各自的主题及关键词,并计算出文档-主题概率分布和主题-词汇概率分布.
def get_single_lda(row):
dictionary = corpora.Dictionary(row[‘text’])
corpus = [dictionary.doc2bow(text) for text in row[‘text’]]
corpus_tfidf = models.TfidfModel(corpus)[corpus]
lda = models.LdaModel(corpus_tfidf, num_topics=best_num, id2word=dictionary,
alpha=’auto’, eta=’auto’,minimum_probability=0, random_state=0)
doc_lda = lda[corpus_tfidf]
temp_array = []
for i in doc_lda:
temp = []
for j in i:
temp.append(j[1])
temp_array.append(temp)
prob = pd.DataFrame(temp_array)
new_column = []
for i in prob.columns:
new_column.append(‘topic_’ + str(i))
prob.columns = new_column
prob[‘lda_name’] = str(lda.print_topics(num_topics=best_num, num_words=10))
prob[‘lda_model’] = lda
return prob
single_lda = data.groupby(‘year’).apply(get_single_lda).reset_index()
del single_lda[‘level_1’]
lda_model_list = single_lda.groupby(‘year’).apply(lambda row:list(row[‘lda_model’])[0]).reset_index()
single_lda
C:\Users\m1381\Anaconda3\lib\site-packages\gensim\models\ldamodel.py:807: RuntimeWarning: overflow encountered in exp2
perwordbound, np.exp2(-perwordbound), len(chunk), corpus_words
Out[33]:
year
topic_0
topic_1
topic_2
topic_3
topic_4
topic_5
topic_6
topic_7
topic_8
…
topic_77
topic_78
topic_79
topic_80
topic_81
topic_82
topic_83
topic_84
lda_name
lda_model
0
2014
0.001662
0.001662
0.001662
0.001662
0.001662
0.001662
0.001662
0.001662
0.859542
…
0.001662
0.001662
0.001662
0.001662
0.001662
0.001662
0.001662
0.001662
[(0, ‘0.010*”丝绸之路” + 0.010*”发展” + 0.010*”高等教育”…
LdaModel(num_terms=96, num_topics=85, decay=0….
1
2014
0.001901
0.001901
0.001901
0.001901
0.001901
0.001901
0.001901
0.001901
0.002905
…
0.001901
0.001901
0.001901
0.001901
0.001901
0.001901
0.001901
0.001901
[(0, ‘0.010*”丝绸之路” + 0.010*”发展” + 0.010*”高等教育”…
LdaModel(num_terms=96, num_topics=85, decay=0….
2
2015
0.001852
0.001896
0.001939
0.001874
0.001852
0.001874
0.001896
0.001874
0.001852
…
0.001852
0.001874
0.001896
0.001852
0.001852
0.687648
0.001852
0.001917
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
3
2015
0.001832
0.001875
0.001918
0.001854
0.001832
0.001854
0.001875
0.001854
0.001832
…
0.001832
0.001854
0.001875
0.001832
0.001832
0.001854
0.001832
0.001897
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
4
2015
0.001630
0.001669
0.001707
0.001650
0.001630
0.001649
0.861286
0.001649
0.001630
…
0.001630
0.001650
0.001669
0.001630
0.001630
0.001650
0.001630
0.001688
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
5
2015
0.001932
0.001978
0.002023
0.001955
0.001932
0.001955
0.001978
0.001955
0.001932
…
0.001932
0.001955
0.001978
0.001932
0.001932
0.001955
0.001932
0.002000
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
6
2015
0.002189
0.002241
0.002292
0.002215
0.002189
0.002215
0.002241
0.002215
0.002189
…
0.002189
0.002215
0.002241
0.002189
0.002189
0.002215
0.002189
0.002266
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
7
2015
0.001324
0.001355
0.041215
0.001340
0.001324
0.001340
0.001355
0.001340
0.001324
…
0.001324
0.001340
0.001355
0.001324
0.001324
0.001340
0.001324
0.001371
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
8
2015
0.001856
0.001900
0.001943
0.001878
0.001856
0.001878
0.001900
0.001878
0.001856
…
0.001856
0.001878
0.001900
0.001856
0.001856
0.001878
0.001856
0.001922
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
9
2015
0.002355
0.002411
0.002466
0.002383
0.002355
0.002383
0.002411
0.002383
0.002355
…
0.002355
0.002383
0.002411
0.002355
0.002355
0.002383
0.002355
0.002438
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
10
2015
0.001495
0.001530
0.001565
0.001512
0.001495
0.001512
0.001530
0.001512
0.001495
…
0.001495
0.001512
0.001530
0.001495
0.001495
0.001512
0.001495
0.001547
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
11
2015
0.001881
0.001925
0.001969
0.001903
0.001881
0.001903
0.001925
0.001903
0.001881
…
0.001881
0.001903
0.001925
0.001881
0.001881
0.001903
0.001881
0.001947
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
12
2015
0.001690
0.001729
0.001769
0.001710
0.001690
0.001710
0.001730
0.001710
0.001690
…
0.001690
0.001710
0.001730
0.001690
0.001690
0.001710
0.001690
0.001749
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
13
2015
0.001990
0.002037
0.002083
0.002013
0.001990
0.002013
0.002037
0.002013
0.001990
…
0.001990
0.002013
0.002037
0.001990
0.001990
0.002013
0.001990
0.002060
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
14
2015
0.001969
0.002016
0.002062
0.001992
0.001969
0.012833
0.002016
0.001992
0.001969
…
0.001969
0.001992
0.002016
0.001969
0.001969
0.001992
0.001969
0.002039
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
15
2015
0.002071
0.002120
0.002168
0.002096
0.002071
0.002096
0.002120
0.002096
0.002071
…
0.002071
0.002096
0.002120
0.002071
0.002071
0.002096
0.002071
0.002144
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
16
2015
0.001904
0.001949
0.001993
0.001926
0.001904
0.001926
0.001949
0.001926
0.001904
…
0.001904
0.001926
0.001949
0.001904
0.001904
0.001926
0.001904
0.001971
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
17
2015
0.001648
0.001687
0.001726
0.001668
0.001648
0.001668
0.001687
0.001668
0.001648
…
0.001648
0.001668
0.001687
0.001648
0.001648
0.001668
0.001648
0.001706
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
18
2015
0.001835
0.001878
0.001921
0.001857
0.001835
0.001857
0.001878
0.001857
0.001835
…
0.001835
0.001857
0.001878
0.001835
0.001835
0.001857
0.001835
0.828423
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
19
2015
0.001516
0.001552
0.001587
0.001534
0.001516
0.001534
0.001552
0.001534
0.001516
…
0.001516
0.001534
0.001552
0.001516
0.001516
0.001534
0.001516
0.001569
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
20
2015
0.001516
0.001552
0.001587
0.001534
0.001516
0.001534
0.001552
0.001534
0.001516
…
0.001516
0.001534
0.001552
0.001516
0.001516
0.001534
0.001516
0.001569
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
21
2015
0.001516
0.001552
0.001587
0.001534
0.001516
0.001534
0.001552
0.001534
0.001516
…
0.001516
0.001534
0.001552
0.001516
0.001516
0.001534
0.001516
0.001569
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
22
2015
0.002085
0.002134
0.002183
0.822605
0.002085
0.002109
0.002134
0.002109
0.002085
…
0.002085
0.002109
0.002134
0.002085
0.002085
0.002109
0.002085
0.002158
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
23
2015
0.002224
0.002276
0.062955
0.002250
0.002224
0.002250
0.002276
0.749713
0.002224
…
0.002224
0.002250
0.002276
0.002224
0.002224
0.002250
0.002224
0.002302
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
24
2015
0.001846
0.001890
0.051328
0.001868
0.001846
0.001868
0.001890
0.001868
0.001846
…
0.001846
0.001868
0.001890
0.001846
0.001846
0.001868
0.001846
0.001911
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
25
2015
0.001624
0.001663
0.001701
0.001643
0.001624
0.001643
0.001663
0.001643
0.001624
…
0.001624
0.001644
0.001663
0.001624
0.001624
0.001644
0.001624
0.001682
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
26
2015
0.001830
0.001872
0.001915
0.001851
0.001830
0.001851
0.001872
0.001851
0.001830
…
0.001830
0.001851
0.001873
0.001830
0.001830
0.001851
0.001830
0.001894
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
27
2015
0.001497
0.001532
0.001567
0.001515
0.001497
0.001515
0.001532
0.001515
0.001497
…
0.001497
0.001515
0.001532
0.001497
0.001497
0.001515
0.001497
0.001550
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
28
2015
0.001956
0.002002
0.002048
0.001979
0.001956
0.001979
0.002002
0.001979
0.001956
…
0.001956
0.001979
0.002002
0.001956
0.001956
0.001979
0.001956
0.002025
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
29
2015
0.001522
0.001557
0.001593
0.001539
0.001522
0.001539
0.001557
0.001539
0.001522
…
0.001522
0.001539
0.001557
0.001522
0.001522
0.001539
0.001522
0.001575
[(0, ‘0.001*”国家” + 0.001*”发展” + 0.001*”战略” + 0…
LdaModel(num_terms=1735, num_topics=85, decay=…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
1174
2018
0.002056
0.002097
0.002035
0.002056
0.636236
0.002070
0.002070
0.002049
0.002056
…
0.002077
0.002070
0.002063
0.002070
0.002056
0.002070
0.002063
0.002063
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1175
2018
0.001450
0.001479
0.001435
0.001450
0.001440
0.001460
0.001460
0.001445
0.001450
…
0.001464
0.001460
0.001455
0.728184
0.001450
0.001460
0.001455
0.001455
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1176
2018
0.002128
0.820810
0.002107
0.002128
0.002114
0.002142
0.002142
0.002121
0.002128
…
0.002150
0.002142
0.002135
0.002142
0.002128
0.002142
0.002135
0.002135
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1177
2018
0.001388
0.001416
0.001374
0.001388
0.001379
0.001397
0.001397
0.001383
0.001388
…
0.001402
0.001397
0.001393
0.001397
0.001388
0.001397
0.001393
0.001393
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1178
2018
0.002126
0.002168
0.002104
0.002125
0.002111
0.002140
0.002140
0.002118
0.002126
…
0.002147
0.002140
0.002133
0.002140
0.002125
0.002140
0.002133
0.002133
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1179
2018
0.002833
0.002890
0.002805
0.002833
0.002814
0.002852
0.002852
0.002824
0.002833
…
0.002862
0.002852
0.002843
0.002852
0.002833
0.002852
0.002843
0.002843
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1180
2018
0.001916
0.001955
0.001897
0.001916
0.001904
0.001929
0.001929
0.001910
0.001916
…
0.001936
0.001929
0.001923
0.001929
0.001916
0.001929
0.001923
0.001923
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1181
2018
0.001571
0.028126
0.001555
0.001571
0.001560
0.001581
0.001581
0.001566
0.001571
…
0.001587
0.001581
0.001576
0.001581
0.001571
0.001581
0.001576
0.001576
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1182
2018
0.001774
0.001810
0.001756
0.001774
0.001762
0.001786
0.001786
0.001768
0.001774
…
0.001792
0.001786
0.001780
0.001786
0.001774
0.001786
0.001780
0.001780
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1183
2018
0.002172
0.002216
0.002151
0.002172
0.002158
0.002187
0.002187
0.002165
0.002172
…
0.002194
0.002187
0.002180
0.002187
0.002172
0.002187
0.002180
0.002180
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1184
2018
0.002083
0.002125
0.002062
0.002083
0.002069
0.002097
0.002097
0.002076
0.002083
…
0.002104
0.002097
0.002090
0.002097
0.110801
0.002097
0.002090
0.002090
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1185
2018
0.002265
0.002310
0.002242
0.002265
0.002250
0.002280
0.002280
0.002257
0.002265
…
0.002288
0.002280
0.002272
0.002280
0.002265
0.002280
0.002272
0.002279
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1186
2018
0.001673
0.001707
0.001656
0.001673
0.001662
0.001684
0.001684
0.001668
0.001673
…
0.001690
0.001684
0.001679
0.001684
0.001673
0.001684
0.001679
0.001679
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1187
2018
0.001877
0.841973
0.001858
0.001877
0.001864
0.001889
0.001889
0.001871
0.001877
…
0.001896
0.001889
0.001883
0.001889
0.001877
0.001889
0.001883
0.001883
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1188
2018
0.002123
0.002165
0.002101
0.002123
0.002108
0.002137
0.002137
0.002115
0.002123
…
0.002144
0.002137
0.002130
0.002137
0.002123
0.002137
0.002130
0.002130
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1189
2018
0.002140
0.002184
0.002119
0.002140
0.002126
0.002155
0.002155
0.002133
0.002140
…
0.002162
0.002155
0.002148
0.002155
0.002140
0.002155
0.002148
0.531738
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1190
2018
0.001990
0.002030
0.001970
0.001990
0.001977
0.002004
0.002004
0.001984
0.001990
…
0.002010
0.002003
0.001997
0.002004
0.001990
0.832400
0.001997
0.001997
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1191
2018
0.001515
0.001546
0.001500
0.001515
0.001505
0.001526
0.001525
0.001510
0.001515
…
0.001531
0.001525
0.001520
0.001525
0.001515
0.001525
0.001520
0.001520
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1192
2018
0.001787
0.001823
0.001769
0.001787
0.001775
0.001799
0.001799
0.001781
0.001787
…
0.001805
0.001799
0.001793
0.001799
0.001787
0.001799
0.001793
0.001793
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1193
2018
0.002066
0.002108
0.002046
0.002066
0.002053
0.002080
0.002080
0.002059
0.002066
…
0.002087
0.002080
0.002073
0.002080
0.002066
0.002080
0.002073
0.002073
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1194
2018
0.002376
0.002424
0.002352
0.002376
0.002360
0.002392
0.002392
0.002368
0.615585
…
0.002400
0.002392
0.002384
0.002392
0.002376
0.002392
0.002384
0.002384
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1195
2018
0.002085
0.002127
0.002064
0.002085
0.002071
0.002099
0.002099
0.002078
0.002085
…
0.002106
0.002099
0.002092
0.002099
0.002085
0.002099
0.002092
0.002092
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1196
2018
0.001959
0.001998
0.001939
0.001959
0.001946
0.001972
0.001972
0.001952
0.001959
…
0.001979
0.001972
0.001966
0.001972
0.001959
0.001972
0.001966
0.001966
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1197
2018
0.001669
0.001702
0.001652
0.001669
0.001658
0.001680
0.001680
0.001663
0.001669
…
0.001686
0.001680
0.001674
0.001680
0.001669
0.001680
0.001674
0.001674
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1198
2018
0.002099
0.002141
0.002078
0.002099
0.002085
0.002113
0.083097
0.002092
0.002099
…
0.002120
0.002113
0.002106
0.002113
0.002099
0.002113
0.002106
0.002106
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1199
2018
0.001487
0.001517
0.001472
0.001487
0.001477
0.001497
0.001497
0.001482
0.001487
…
0.001502
0.001497
0.001492
0.001497
0.001487
0.001497
0.001492
0.001492
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1200
2018
0.001539
0.001570
0.001524
0.001539
0.001529
0.001550
0.001549
0.001534
0.001539
…
0.001555
0.001549
0.001544
0.001549
0.001539
0.001550
0.001544
0.001544
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1201
2018
0.002018
0.002058
0.001997
0.002017
0.002004
0.002031
0.816952
0.002011
0.002017
…
0.002038
0.002031
0.002024
0.002031
0.002017
0.002031
0.002024
0.002024
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1202
2018
0.001913
0.001951
0.001894
0.001913
0.001900
0.001926
0.001926
0.001906
0.001913
…
0.001932
0.001926
0.001919
0.001926
0.001913
0.001926
0.001919
0.001919
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1203
2018
0.001467
0.001496
0.001452
0.001467
0.001457
0.800488
0.001477
0.001462
0.001467
…
0.001482
0.001477
0.001472
0.001477
0.001467
0.001477
0.001472
0.001472
[(0, ‘0.010*”文学” + 0.008*”丝路” + 0.007*”境外” + 0…
LdaModel(num_terms=3345, num_topics=85, decay=…
1204 rows × 88 columns
In [40]:
# 2014年数据算是异常,数据集太少,只有96条
# 基于编辑距离的主题名相似度的topic对齐
# 每一个year 每一个topic有对应的主题名字
df_topic_top = pd.DataFrame()
count = np.min(single_lda[‘year’])
for k in lda_model_list[0]:
topic_list = k.print_topics(num_topics=best_num)
topic_name_list = []
topic_data_list = []
for i in topic_list:
topic_name_list.append(‘topic_’ + str(i[0]))
list_text = i[1].split(‘”‘)
new_text_list = []
for j,text_value in enumerate(list_text):
if ((j%2!=0)&(len(text_value)>1)):
new_text_list.append(text_value)
topic_data_list.append(‘,’.join(new_text_list))
df_topic_top[‘topic_num’] = topic_name_list
df_topic_top[‘topic_data_’ + str(count)] = topic_data_list
count += 1
# def get_max_num(s1, s2):
# s1_list = s1.split(‘,’)
# s2_list = s2.split(‘,’)
# return len(list(set(s1_list).intersection(set(s2_list))))
# 寻找对应topic,取最大年为基准
max_year = np.max(single_lda[‘year’])
k = np.max(single_lda[‘year’]) – 1
record = []
record.append(range(0,best_num,1))
while k >= np.min(single_lda[‘year’]):
# 得到对应数据
max_list = df_topic_top[‘topic_data_’ + str(max_year)]
k_list = df_topic_top[‘topic_data_’ + str(k)]
record_1 = []
for i, value1 in enumerate(max_list):
record_2 = []
for j, value2 in enumerate(k_list):
record_2.append(Levenshtein.jaro_winkler(value1.replace(‘,’,”), value2.replace(‘,’,”)))
record_1.append(np.argmax(record_2))
# 直接将数据
record.append(record_1)
k -= 1
record = np.array(record)
#### 显示更多topic
new_list_pos = []
df_topic_top = pd.DataFrame()
count = np.min(single_lda[‘year’])
for k in lda_model_list[0]:
topic_list = k.print_topics(num_topics=best_num, num_words=100)
topic_name_list = []
topic_data_list = []
for i in topic_list:
topic_name_list.append(‘topic_’ + str(i[0]))
list_text = i[1].split(‘”‘)
new_text_list = []
for j,text_value in enumerate(list_text):
if ((j%2!=0)&(len(text_value)>1)):
new_text_list.append(text_value)
topic_data_list.append(‘,’.join(new_text_list))
df_topic_top[‘topic_num’] = topic_name_list
df_topic_top[‘topic_data_’ + str(count)] = topic_data_list
count += 1
# 输出的矩阵是对应主题列,第一list是18年主题
# 取对应top查看
pos = 2
result = pd.DataFrame()
topic_and_time = []
text = []
for i,value in enumerate(record):
topic_and_time.append(str(max_year-i) + ‘/topic_’ + str(value[pos]))
text.append(list(df_topic_top[(df_topic_top[‘topic_num’]==’topic_’ + str(value[pos]))][‘topic_data_’ + str(max_year-i)])[0])
result[‘time_and_topic’] = topic_and_time
result[‘text’] = text
result.to_csv(‘result.csv’, index=False, encoding=’gbk’)
result
Out[40]:
time_and_topic
text
0
2018/topic_2
教育,发展,一带,一路,高校,人才,提出,国家,建设,人才培养,培养,我国,倡议,战略,创新…
1
2017/topic_16
发展,战略,建设,教育,国家,人才,高校,一路,一带,提出,我国,培养,人才培养,中国,合作…
2
2016/topic_65
发展,战略,国家,高校,教育,人才,培养,建设,提出,我国,中国,人才培养,实施,经济,创新…
3
2015/topic_0
国家,发展,战略,建设,高校,人才,教育,创新,提出,我国,培养,人才培养,合作,国际,中国…
4
2014/topic_0
丝绸之路,发展,高等教育,教科文,云南,大学,陕西,建设,进一步,研究院,智能,成立,中心,…
In [35]:
# 处理数据
dict_list = []
new_lda = list(lda_model_list[0])
new_lda.reverse()
for i,value in enumerate(new_lda):
my_dict = {}
topic_list = value.print_topics(num_topics=best_num, num_words=100)
temp = topic_list[record[i][pos]][1]
temp = re.split(‘ |\*|\+’, temp.replace(‘ ‘,”).replace(‘”‘,”))
for k,value_2 in enumerate(temp):
if (k%2==0):
my_dict[temp[k+1]] = float(value_2)
dict_list.append(my_dict)
dict_list.reverse()
deal_result = pd.read_csv(‘data/deal_result.csv’, encoding=’gbk’)
In [44]:
# 绘制图像
# 获取词语词典
from pylab import *
mpl.rcParams[‘font.sans-serif’] = [‘SimHei’]
my_text = []
for i in deal_result[‘text’]:
my_text.extend(re.split(‘ |,|,’, i.replace(‘ ‘,”)))
my_text = np.unique(my_text)
need_plot = pd.DataFrame()
need_plot[‘time’] = np.arange(2014,2019,1)
for i in my_text:
xu_list = []
for j in dict_list:
try:
xu_list.append(j[i])
except Exception:
xu_list.append(0)
print(xu_list)
need_plot[i] = xu_list
need_plot
year_list = need_plot[‘time’]
del need_plot[‘time’]
topic = np.array(need_plot).T
fig, ax = plt.subplots(figsize = (17,17))
sns.heatmap(pd.DataFrame(topic, columns = year_list, index=need_plot.columns),
vmax=np.max(topic),vmin=np.min(topic), xticklabels= True, yticklabels= True, square=True, cmap=”Blues”)
[0, 0.005, 0, 0, 0.002]
[0.01, 0, 0, 0, 0.003]
[0, 0, 0, 0.003, 0]
[0.01, 0, 0, 0.003, 0]
[0.01, 0.001, 0, 0.002, 0.002]
[0.01, 0.004, 0, 0.002, 0]
[0, 0, 0.007, 0, 0]
[0.01, 0, 0, 0, 0]
[0.01, 0.003, 0, 0.002, 0.003]
[0, 0, 0, 0.002, 0.003]
[0.01, 0, 0, 0.004, 0.004]
[0.01, 0.004, 0, 0, 0]
[0, 0, 0.005, 0.005, 0.005]
[0.01, 0, 0, 0, 0]
[0, 0.003, 0, 0, 0]
[0, 0, 0, 0, 0]
[0, 0.003, 0.001, 0.003, 0.002]
[0.01, 0, 0, 0.002, 0.003]
Out[44]:

In [ ]: