合成数据
ICML spotlight 一种会「进化」的合成数据!无需上传隐私,也能生成高质量垂域数据
张剑清提出PCEvolve框架,利用少量标注样本和隐私数据生成垂域数据集。该方法通过进化过程确保数据隐私保护,并在医学、工业制造等领域验证其有效性。
一亿美金种子轮,刷新硅谷具身智能融资记录!周衔、许臻佳、李旻辰等华人合伙创业
硅谷新创公司Genesis AI获得1.05亿美元种子轮融资,旨在通过生成式物理引擎和大规模真实机器人数据整合,突破AI的’数据魔咒’,实现最高人才密度的创新组织,并推动物理智能领域的研究。
成立仅2年 与NVIDIA、Figure、智元机器人深度合作!这家公司正在打通具身智能“最后一公里”
杨海波在具身智能产业大会上指出,合成数据是打通具身智能的关键。他认为物理交互和丰富场景对于机器人学习至关重要。他强调了具备足够真实的物理交互能力、有人示范在环以及丰富多样场景的必备条件。
Synthetic-Data-Zero-RL:让 RL 左脚踩右脚
MLNLP社区致力于促进自然语言处理领域的学术与产业交流合作。通过PromptCoT等方法生成高质量数据集,提高模型性能。近期实验表明基于PromptCoT合成的数据可用于零样本强化学习训练,提升效果接近官方预训练模型。