张超 作品数:7 被引量:7 H指数:2 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 国家重点基础研究发展计划 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
一种基于反馈信息的地址寄存器提升方法 2009年 在MIPS,ALPHA,SPARC和PowerPC等体系结构中,对全局变量和静态变量的访问一般采用间接寻址的方式.由于变量地址和变量值不在同一数据段,使得数据访问的局部性不好.这样,每次访问变量地址会导致大量冗余的数据cache不命中访存操作.此外,这种寻址方式会产生两条连续的有数据依赖的操作,降低了程序的指令级并行性.提出了基于反馈信息的地址寄存器提升算法(address register promotion based on feedbacks,ARPF).该算法减少了对全局变量地址和静态变量地址的冗余访问,提高了程序的ILP(instruction level parallelism),同时避免了由于寄存器压力增加导致性能下降.在龙芯编译器①上实现了该算法.实验表明ARPF对SPEC CPU2000INT所有测试用例有1%~6%的性能提升. 张超 吕方 王蕾 冯晓兵关键词:指令级并行 一种使用空闲寄存器类作为快速溢出空间的优化方法 本发明公开了一种使用空闲寄存器类作为快速溢出空间的优化方法。该方法包括下列步骤:计算活跃区间的溢出代价并采用插桩工具以及静态分析汇编代码相结合的方式对应用程序中的溢出代价进行评估;在原有寄存器分配中,为每个应用程序确定合... 吕方 冯晓兵 杨扬 张超 王蕾文献传递 一种使用空闲寄存器类作为快速溢出空间的优化方法 本发明公开了一种使用空闲寄存器类作为快速溢出空间的优化方法。该方法包括下列步骤:计算活跃区间的溢出代价并采用插桩工具以及静态分析汇编代码相结合的方式对应用程序中的溢出代价进行评估;在原有寄存器分配中,为每个应用程序确定合... 吕方 冯晓兵 杨扬 张超 王蕾文献传递 支持隐私保护的社交网络信息推荐方法 被引量:4 2020年 针对社交网络信息推荐中的信息传播带来隐私泄露的问题,结合信息传播模型,提出了一种支持隐私保护的社交网络信息推荐方法,通过好友的兴趣度、熟悉度和兴趣相似度推测用户兴趣,进行文本匹配和推荐候选集排序;通过个性化隐私偏好设置允许用户设置受限访问用户列表,并使用隐私保护方法计算信息传播至黑名单用户的概率,设置隐私泄露阈值对黑名单用户访问隐私博文的概率进行控制,达到信息推荐中保护用户隐私的目的。实验结果表明,所提方法可以在保证推荐效果的同时更好地保护用户隐私。 张超 梁英 梁英关键词:社交网络 信息推荐 隐私保护 访问控制 服务于程序并行的程序行为分析研究 当前,单片多核处理器已经成为处理器体系结构发展的新趋势。一方面,多核处理器的计算资源更丰富,充分发掘程序中的并行性对于发挥多核处理器的计算潜能具有重要意义:另一方面,在多核处理器中,同一个芯片上的多个处理器核共享同一个片... 张超关键词:任务调度 基于区域平均执行时间和数据依赖信息的可能并行区域识别 被引量:2 2008年 随着多核处理器逐渐成为处理器发展的新趋势,为了持续提高程序性能,必须并行执行应用程序.传统的自动并行技术能够很好地并行科学计算应用中的规则循环,但对于含有大量函数调用和指针引用的不规则程序,目前还不能有效地对其实施并行.针对这一现状,文中提出了基于区域平均执行时间和数据依赖信息的可能并行区域识别方法来对一些不规则程序实施高效并行,主要贡献如下:(1)自动识别程序中的多种并行性,不仅包括传统并行性分析中的循环迭代间的细粒度并行性,而且也包括传统并行性分析尚不能有效处理的循环体和函数调用点间的粗粒度并行性.对于程序中蕴含的众多并行性,文中基于区域平均执行时间实施收益分析来选择合适的并行区域实施并行;(2)自动识别可能并行区域间数据依赖关系的数量、类型以及导致数据依赖关系的程序变量.基于文中的分析结果,作者使用面向行为的投机并行系统(behavior oriented parallelism)对SPEC2006中的4个测试用例实现了并行化.并行化后的程序在Intel和AMD多核处理器上分别得到了300%和260%的平均性能加速. 张超 王蕾 向晓娅 冯晓兵多核处理器上基于程序访存阶段的独立任务调度 随着多核处理器的发展,片外访存带宽逐渐成为影响程序性能的主要因素。为了解决这个问题,很多研究工作通过提高cache利用率来降低程序执行过程中的片外访存数量。本文提出了一种任务调度算法来解决同时执行的多个独立任务竞争片外访... 张超 王蕾关键词:多核处理器 调度程序 函数调用 文献传递