MOLLEO的多目标优化成果显著 - 飞书文档
https://docs.feishu.cn/v/wiki/Sl5wwLTSAi7pdekfnUvcCfk4nMf/a7然而,这些算法的一个主要缺点是它们随机生成候选结构而不利用任务特定的信息,从而导致需要大量的目标函数评估。因为评估属性的昂贵,分子优化除了找到最佳期待属性的分子 ...
然而,这些算法的一个主要缺点是它们随机生成候选结构而不利用任务特定的信息,从而导致需要大量的目标函数评估。因为评估属性的昂贵,分子优化除了找到最佳期待属性的分子 ...
随着机器学习的高速发展和得益于早期的探索(包括构建了简单可用的优化目标与效果衡量方法),大量的算法被研发,包括组合优化,搜索,采样算法(遗传算法、蒙特卡洛树搜索、强化 ...
在对齐LLM 方面,基于人类反馈的强化学习(RLHF)是一种突破性的技术。该方法催生了GPT-4、Claude 和Gemini 等强大模型。RLHF 之后,人们也探索了多种多样的对齐LLM 的方法。
参考上述流程图,知识库构建主要包括数据加载,文本切片和内容向量化三个部分,其中核心处理模块是文本切片。目前主要有2类切分方法,一种是基于策略规则,一种是基于算法模型。
... 目标的分子时可能会出现问题,因为LLM可能难以满足精确的数值约束或优化特定的数值目标。此外,单纯依赖LLM提示的方法可能会生成物理基础较差的分子,或者生成无法解码 ...
它作为机器学习研究人员和从业者的全面参考,同时也适合初学者理解ICRL的定义、进展和重要挑战。我们首先正式定义了该问题,并概述了在各种场景下促进约束推断的算法框架。
多阶段方法多阶段方法将规划过程分解为不同的阶段,旨在改善LLM在复杂推理和问题解决任务中的性能。SwiftSage [105] 是一个受到双过程理论启发的框架,结合了行为克隆和引导 ...
尽管大规模语言模型(LLMs)表现出强大的推理和任务分解能力,但在面对具有复杂约束的环境(如数学问题解决或生成可接受的动作)时仍存在挑战。为了解决这些挑战,几种方法将LLMs ...
梯度攻击通过利用模型的梯度信息,生成有害响应。例如,使用梯度坐标贪婪算法(GCG)生成后缀,使模型生成有害内容。此方法通过梯度优化生成能避开模型检测 ...
优化索引结构包括调整块的大小以捕获相关上下文,跨多个索引路径进行查询,以及通过利用图数据索引中节点之间的关系合并来自图结构的信息以捕获相关上下文。