微软开源MarkItDown:一键转换文档为Markdown,LLM时代的必备利器!
微软开源MarkItDown工具,支持PDF、Word等多种文件转换为Markdown格式,并具备调用大语言模型描述图像的功能。使用简单,代码几行即可实现转换。
微软开源MarkItDown工具,支持PDF、Word等多种文件转换为Markdown格式,并具备调用大语言模型描述图像的功能。使用简单,代码几行即可实现转换。
Google发布了全新的Veo 2视频生成模型和Imagen 3图像生成模型。测试结果显示,Veo 2在画面质量和提示词遵从度上都超越了OpenAI的Sora。此外,Imagen 3在文字渲染和细节呈现方面表现优异,创下了1115的新高分。Google已经在多个平台上推出这两款产品。
DiffusionDrive是一种新型截断扩散模型,旨在实现端到端的自主驾驶,其在NAVSIM上的PDMS提升了3.5分,提高了64%多样性,并实现了88.1 PDMS记录和45fps实时运行速度。
智谱近期完成30亿人民币融资,并宣布将用于进一步研发大模型,目标从回答问题升级到解决复杂推理、多模态任务。公司已公开商业化战绩,包括年收入增长超30倍和付费客户数增长超20倍等。
2024年,AI大模型公司智谱完成新一轮30亿人民币融资,将用于研发和支撑行业生态发展。智谱估值领先,业务高速增长,商业化收入增长100%以上,MaaS平台吸引70万用户。智谱CEO张鹏表示AGI开发还有大量任务等待,相信技术成熟后可助力解决复杂问题。
智谱宣布完成30亿人民币新一轮融资,引入多家战投及国资。公司已推出多款产品并在多个行业实现商业化应用。智谱强调将继续加强预训练研究,并探索Agent技术的应用前景,目标是达到AGI级别的能力。
2024 T-EDGE创新大会暨钛媒体财经年会在北京市大兴区举行,会议主题为‘ALL-in on Globalization ,ALL-in on AI’。商汤科技董事长&CEO徐立在AI论坛上分享了他对AI 2.0的看法及当前的发展情况,包括算力、模型和应用的相互关系,并提出了未来数据中心建设的重要性。