明略科技开源TensorBoard.cpp,助力大模型预训练

xiwang2023-08-11 15:45:11TechWeb.com.cn

8月11日消息,近日,明略科技集团实现了机器学习可视化工具——TensorBoard的C++接口,进一步丰富了基于C++的大模型项目工具集,使得大模型预训练过程监控更加便捷、高效,加速营销领域大模型预训练进程。该工具已在Github开源。

TensorBoard是Google开发的一款机器学习可视化工具,常用于监测机器学习过程的各项指标。

明略科技高级技术总监赵亮介绍:“在大模型训练过程中,数据监测是一个重要维度,而TensorBoard通过可视化模型中的各种参数和结果,例如记录大模型训练过程的Loss变化、验证集的PPL变化、学习率变化、Token消耗量、单步参数更新时延等指标,帮助分析训练状态,发现训练过程中出现的问题并及时采取干预措施,提升大模型训练进程和效果。”

明略科技开源的C++接口TensorBoard工具页面

此前,TensorBoard仅支持Python语言接口。此次明略科技通过C++实现TensorBoard,将进一步丰富基于C++实现的大模型项目工具集,大幅提升模型训练监测效率,加速模型训练进程,改写接口后的工具将通过多维度的数据模式展示训练指标,包括标量、直方图、图像、图像合集、音频、文本等数据模式。该工具包通过github项目Tensorboard.cpp分享,助力更多研究者和开发者参与并加速大模型的研发进程,推动人工智能多领域的应用探索。


明略科技在Github开源的两款工具包:ASR-BlockFormer与tensorboard.cpp

明略科技集团CTO郝杰表示:“我们要在更高效、更低成本的要求下做出营销领域的大模型,通过自适应技术提升大模型的能力。好的行业大模型需要具备通用大模型的逻辑性、语言顺畅度,同时还需要实现通用大模型所不具备的,在某个行业内或具体的领域中的真实性、专业性。我们以明略科技凭借17年来积累的海量行业数据为基础,从客户实际需求出发,借助庞大的数据和知识库进行增强训练,满足客户多样化的任务和场景需求。在训练监测可视化工具的加持下,我们将提升训练速度,及时发现问题,为客户打造一个更加可靠、效果更好的行业大模型。”

 

 

苹果的“ACDC 项目”正在为数据中心开发人工智能芯片

据华尔街日报报道,苹果公司正在研发一款可在数据中心伺服器上运行人工智能(AI)软件的晶片,该项目代号为“ProjectACDC”,旨在帮助苹果在AI领域取得竞争优势。虽然晶片推出时间尚未确定,但苹果已承诺将在6月的全...

阿里披露对月之暗面投资详情:8亿美元购入约36%股权

5月24日消息,阿里巴巴集团在港交所公布了2024财年年报,年报中披露了阿里巴巴对人工智能初创公司月之暗面(MoonshotAI)的投资详情。截至2024年3月31日止年度,阿里巴巴投资合共约8亿美元(约人民币59亿元)购入月之...

TikTok内测AI生成歌曲功能:用户只需输入歌词文本 可自选曲风

IT之家1月19日消息,TikTok目前正在测试一项新功能:借助大语言模型Bloom的能力,使用AI来生成歌曲。具体来看,用户可在上传内容时提供歌词文本,随后TikTok会引导用户使用“AISong”功能为文本添加声音,用户还可以...

「天工2.0」MoE大模型发布 「天工AI」APP向C端用户免费开放

2月6日消息,昆仑万维今日正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP。据介绍,这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用...

微软谷歌等AI巨头齐聚首尔:承诺安全开发人工智能模型,必要时关闭尖端系统

5月22日消息,路透社报道,微软、谷歌、OpenAI等16家科技公司在21日和22日举行的“人工智能(AI)首尔峰会”上承诺安全开发AI模型,在无法控制最极端风险的情况下关闭其尖端系统(cutting-edgesystems)。参会的公司...

上一篇:全球首个内置ChatGPT智能音箱ChatMini 8月17日发布
下一篇:AI缺芯,英伟达卖断货