日前,JCR一区期刊CMC(Computers, Materials & Continua)连续发表我校副校长樊晓平教授领衔的财经大数据研究团队两篇研究论文Expanding Hot Code Path for Data Cleaning on Software Graph(http://www.techscience.com/cmc/ v63n2/38541)和Visualization Analysis for Business Performance of Chinese Listed Companies Based on Gephi(http://www.techscience.com/cmc/v63n2/38554)。CMC主编已力邀团队制作这些论文的展示材料(presentation),将作为优秀成果在世界范围内公开推广。
图1 Expanding Hot Code Path for Data Cleaning on Software Graph
图2 Visualization Analysis for Business Performance of Chinese Listed Companies Based on Gephi
大数据级的图形分析工具Spark GraphX受内存大小限制,必须将图形数据减到合适的大小,但这会引起原始图形的失真。论文“Expanding Hot Code Path for Data Cleaning on Software Graph”使用SEQUITUR数据压缩算法找出热代码路径并将其存储为有向无环图。该方法用40%的程序代码存储了不失真的软件图,是软件图大数据清洗技术的重要突破。
进行公司绩效评估时,传统方法不能反映整个证券市场公司经营状况的分布特征。论文“Visualization Analysis for Business Performance of Chinese Listed Companies Based on Gephi”介绍了财经大数据团队如何用Gephi把所有上市公司的评估结果转换为节点和边,并直接以图形形式显示绩效。该方法用微观水平的可视化分析技术找出影响公司运营的关键因素,是可视化分析技术在财经领域的创新应用。
图3 Gephi上市公司评估结果可视化效果
这两篇论文的刊发,是继财经大数据团队在JCR一区期刊IEEE Access之后又一批高水平研究成果。论文的共同作者中还包括2018级大数据班刘旭同学、2019级大数据实验班郭子懿同学,这是两位同学参与团队研究工作而发表的第二篇英文期刊论文,也彰显着我校创新人才培养效果初露锋芒。
考研在线—做考研人信赖的考研网站