移动通信领域有了新SOTA:华为出品,精准预测用户行为
华为GTS部门AI算法团队提出GTS-LUM模型,实现移动通信用户精准行为洞析与多跳预测。该方法在多个评估指标上显著优于Meta的HSTU和字节的HLLM。
华为GTS部门AI算法团队提出GTS-LUM模型,实现移动通信用户精准行为洞析与多跳预测。该方法在多个评估指标上显著优于Meta的HSTU和字节的HLLM。
V-Droid使用验证器驱动架构在移动GUI任务自动化中实现了高成功率和低延迟。通过解析UI界面提取基本操作,并利用精细训练的验证器评估候选动作,V-Droid在多个基准测试中的任务成功率显著提高,决策响应时间降至0.7秒。
Genspark超级智能体发布,能够在无需编程的情况下执行复杂任务,包括制作做饭视频和创建HTML游戏。其背后公司MainFunc由前百度高管景鲲创立,展示了从AI搜索转向智能体的新方向。
V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回归流匹配解码器进行视觉重建,显著提高了压缩效率和生成质量。
CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
国产RISC-V高性能服务器芯片‘灵羽’亮相,单核多核设计提升性能,并支持DDR5内存和PCIe 5.0接口。睿思芯科创始人谭章熹博士曾任RISC-V指令集研发者,公司已推出首款产品并完成广泛软件适配。