姜小波
- 作品数:10 被引量:14H指数:3
- 供职机构:华南理工大学电子与信息学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于CMMB标准的LDPC码动态译码算法研究被引量:3
- 2010年
- 针对低密度奇偶校验码(LDPC)的置信传播算法(BP)、分层算法(LBP)在迭代过程中以随机的节点顺序更新,不能快速达到收敛的特点,本文详细分析了一种选择可靠度小的节点先更新的动态译码算法,并以应用于CMMB标准的LDPC码进行性能仿真。与LBP算法相比,动态算法的译码收敛速度明显提高,译码的平均迭代次数减少50%。最后对动态算法的译码复杂度进行了分析。
- 姜小波吴升
- 关键词:CMMB
- 一种高速crossbar调度算法及其性能分析被引量:1
- 2010年
- 分析了高速crossbar调度算法iSLIP在处理突发业务时性能严重恶化的原因。结合LQF/iLQF算法的思想,提出了又一种输入排队crossbar调度算法iPGQM。仿真结果表明:该调度算法在均匀业务流量下和iSLIP算法的性能基本相同;在突发业务的条件下,iPGQM算法具有更好的抗突发特性;特别在重负载的条件下,与iSLIP算法相比,不仅具有更高的吞吐量,而且平均延迟降低了10%左右。
- 姜小波杜小伟
- 关键词:CROSSBAR调度算法
- 用于CMMB的低运算复杂度LDPC解码算法被引量:4
- 2010年
- 本文提出了两种基于变量节点可靠度的LDPC解码算法.第一,针对传统的可靠度判决算法会产生比较严重的误判现象,导致译码性能降低.本文提出了一种改进的可靠度判决算法,它降低了变量节点的误判概率.在AWGN和瑞利信道仿真中,性能都有显著的提高,性能超过了标准BP算法.第二,提出了分层可靠度算法.和标准BP算法相比较,性能提高了0.1dB,收敛速度提高了一倍,计算复杂度降低大约65%.
- 姜小波聂正华
- 关键词:LDPCCMMB瑞利衰落信道
- 规则压缩模型和灵活架构的Transformer加速器设计
- 2024年
- 基于注意力机制的Transformer模型具有优越的性能,设计专用的Transformer加速器能大幅提高推理性能以及降低推理功耗。Transformer模型复杂性包括数量上和结构上的复杂性,其中结构上的复杂性导致不规则模型和规则硬件之间的失配,降低了模型映射到硬件的效率。目前的加速器研究主要聚焦在解决模型数量上的复杂性,但对如何解决模型结构上的复杂性研究得不多。该文首先提出规则压缩模型,降低模型的结构复杂度,提高模型和硬件的匹配度,提高模型映射到硬件的效率。接着提出一种硬件友好的模型压缩方法,采用规则的偏移对角权重剪枝方案和简化硬件量化推理逻辑。此外,提出一个高效灵活的硬件架构,包括一种以块为单元的权重固定脉动运算阵列,同时包括一种准分布的存储架构。该架构可以高效实现算法到运算阵列的映射,同时实现高效的数据存储效率和降低数据移动。实验结果表明,该文工作在性能损失极小的情况下实现93.75%的压缩率,在FPGA上实现的加速器可以高效处理压缩后的Transformer模型,相比于中央处理器(CPU)和图形处理器(GPU)能效分别提高了12.45倍和4.17倍。
- 姜小波邓晗珂莫志杰黎红源
- 关键词:TRANSFORMER硬件加速器机器翻译
- 低功耗异步LDPC解码器运算通路设计被引量:1
- 2013年
- 本文设计了异步LDPC解码器运算通路,利用异步电路减少信号到达时间不一致引起的毛刺和时钟引起的功耗.利用输入数据的统计特性设计了运算通路中的主要运算单元,减少了冗余运算.本文还实现了同步运算通路和基于门控时钟的运算通路作为比较.三种设计采用相近的架构,在0.18μmCMOS工艺下实现相同的功能.仿真结果表明,提出的异步设计功耗最小,相比于同步设计和基于门控时钟设计,分别节省了42.0%和32.6%的功耗.虽然性能稍逊于同步设计,但优于门控时钟设计.其中,同步设计的延时是1.09ns,基于门控时钟的设计延时是1.61ns,而异步设计则是1.20ns.
- 姜小波叶德盛吴文涛徐向民
- 关键词:LDPC码低功耗比较器加法器
- 高效的用于CMMB的LDPC解码器设计
- 2013年
- 本文设计了高效率的支持两个码率的CMMB标准的LDPC解码器。论文采用分层修正最小和算法和存储器压缩技术减少存储器资源的使用;采用备份存储器方法,仅用很少的存储器代价,解决CMMB的LDPC码存在的存储器读写冲突;采用硬件资源复用,可以同时处理1/2码率和3/4码率,减少资源消耗。本文设计的LDPC解码器,在SMIC 0.18 m工艺下进行了综合,综合结果显示,解码器的面积8.55mm2,功耗215.4mW。
- 姜小波黎红源梁祥泰
- 关键词:解码器
- 基于语义先验知识与类型嵌入的复杂实体识别被引量:1
- 2023年
- 实体识别是信息抽取的关键任务.随着信息抽取技术的发展,研究人员从简单实体的识别转向复杂实体的识别.然而,复杂实体缺乏明显的特征且在句法结构与词性组成上更加复杂多样,给实体识别带来了巨大挑战.此外,现有模型广泛采用基于跨度的方法来识别嵌套实体,在实体边界检测方面呈现出模糊化,影响识别的性能.针对这些问题和挑战,提出了一种基于语义先验知识与类型嵌入的实体识别模型GIA-2DPE.该模型使用实体类别的关键词序列作为语义先验知识来提升对实体的认知,并通过类型嵌入捕获不同实体类型的潜在特征,然后通过门控交互注意力机制将先验知识与类型特征相融合以辅助复杂实体识别.另外,模型通过2D概率编码来预测实体边界,并利用边界特征和上下文特征来增强对边界的精准检测,从而提升嵌套实体的识别效果.在7个英文数据集和2个中文数据集上进行了广泛实验.结果表明,GIA-2DPE超越了目前最先进的模型;并且在ScienceIE数据集的实体识别任务中,相对基线F1分数取得了最高10.4%的提升.
- 姜小波何昆阎广瑜
- 关键词:信息抽取
- LDPC码的交替迭代分层置信传播译码被引量:1
- 2013年
- 低密度奇偶校验码(LDPC)通过迭代译码算法进行译码,例如置信传播算法(belief-propagation)便是其中一种译码方式。标准BP算法是并行译码,在更新所有校验节点及比特节点过程中,使用上一次迭代的更新信息。为了提高一定迭代次数下的收敛速度,在研究不同算法的基础上,如Layered BP算法(LBP)和Shuffled BP算法(SBP),通过改变节点的更新顺序,提出了改进的shuffled迭代译码算法。相对于普通的SBP算法,文章所提改进型SBP算法是传统置信传播收敛速度的两倍,并且在保持性能的同时降低复杂度。最后给出了CMMB标准下LDPC码的仿真结果。
- 姜小波李芳苑
- 关键词:低密度奇偶校验码迭代译码CMMB
- 一种新型低功耗异步比较器的设计方法被引量:3
- 2012年
- 本文利用输入数据的统计特性,设计了两种低功耗异步比较器——异步行波比较器和提前终止异步比较器.异步行波比较器从第一个不相等的数位开始停止运算,但要把结果传到最低位,消耗部分功耗.提前终止异步比较器通过修改真值表,基于新的比较单元电路和终止判断电路,在第一个不相等的数位停止运算并立即输出比较结果,节省不必要的功耗.新设计的异步比较器和用于对比的同步比较器(BCL比较器和门控时钟比较器)均用SMIC0.18μm工艺实现.仿真结果表明,提前终止异步比较器功耗最低,与同步BCL比较器和门控时钟比较器相比,在随机数据和来自LDPC解码器的数据下,分别节省了87.1%、84.5%和37.5%、28.6%的功耗.
- 姜小波叶德盛
- 关键词:低功耗比较器
- 自生成软信息低误码平层NAND闪存ECC纠错架构
- LDPC码被应用于NAND闪存,但存在软信息获取和误码平层问题.本文提出了本文提出一个基于BCH码+LDPC码的NAND闪存新型ECC纠错架构.由BCH码生产软信息,提供给LDPC码.利用超算中心的计算能力,提出了一种低...
- 姜小波谭雪青周观太朱翔宇
- 关键词:NAND闪存