上传备份

master
王兵 1 month ago
parent d74b599a25
commit e9ce6f25d1

@ -15,7 +15,7 @@ public class Helper {
private static OpenAiStreamingChatModel openAiStreamingChatModel = OpenAiStreamingChatModel.builder()
// openai地址
.baseUrl("http://192.168.88.106:11434/v1")
.baseUrl("http://192.168.88.105:11434/v1")
// 密钥
.apiKey("1")
//模型名称
@ -24,7 +24,7 @@ public class Helper {
// 低 temperature接近 0模型会更倾向于选择概率最高的 token生成的文本更确定性、保守接近 “标准答案”。适合需要精确性的场景,如数学计算、事实性问答、代码生成。
// 高 temperature如 1.0 或更高):模型会增加低概率 token 的选择机会,生成的文本更随机、多样,可能包含更多创意或意外内容。适合需要开放性、创造性的场景,如故事写作、诗歌生成、对话模拟。
// 调整概率分布的平滑度,创造性内容生成(如故事、诗歌)
.temperature(0.7)
.temperature(0.3)
// 替代温度采样temperature sampling的策略主要用于限制模型生成时的词汇选择范围
// 限制候选词的范围,精确性要求高的任务(如问答、摘要)
// 高精确性任务如数学计算、代码生成、事实性问答top_p = 0.7 ~ 0.8 限制候选词范围,减少模型编造错误信息的可能性。
@ -51,7 +51,7 @@ public class Helper {
// 对话生成 frequencyPenalty = 0.7~1.0 防止机器人重复使用相同话术,增强自然度。
// 技术文档 / 代码生成 frequencyPenalty = 0 保留专业术语的一致性,避免不必要的替换。
// 长文本生成 frequencyPenalty = 0.3~0.7 减少长段落中的重复表述。
.frequencyPenalty(0.0)
.frequencyPenalty(0.3)
// 惩罚已出现的主题 当模型在生成过程中多次提及某个主题如人物、事件、概念presencePenalty 会降低该主题相关词汇再次被选中的概率。
// 鼓励引入新内容:与 frequencyPenalty惩罚词汇重复不同presencePenalty 更关注主题层面的多样性,避免模型围绕同一主题反复阐述。
// 范围:通常为 -2.0 到 2.0 之间的浮点数。
@ -71,7 +71,7 @@ public class Helper {
.build();
private static OpenAiChatModel openAiChatModel = OpenAiChatModel.builder()
.baseUrl("http://192.168.88.106:11434/v1")
.baseUrl("http://192.168.88.105:11434/v1")
.apiKey("1")
.modelName("qwen2.5:0.5b")
.maxTokens(4096)
@ -81,7 +81,7 @@ public class Helper {
.logResponses(true)
.build();
private static OpenAiEmbeddingModel openAiEmbeddingModel = OpenAiEmbeddingModel.builder()
.baseUrl("http://192.168.88.106:11434/v1")
.baseUrl("http://192.168.88.105:11434/v1")
.apiKey("1")
.modelName("bge-m3")
.logRequests(true)

@ -25,11 +25,10 @@ public class Json_Example {
.rootElement(
JsonObjectSchema.builder()
.addProperty("data", JsonArraySchema.builder()
.description("省份列表")
.description("数据")
.items(
JsonObjectSchema.builder()
.addStringProperty("name", "省份")
.addStringProperty("car", "车牌前缀")
.addStringProperty("text", "朝代")
.build()
).build()
).build()
@ -37,7 +36,7 @@ public class Json_Example {
).build();
ChatRequest build = ChatRequest.builder()
.messages(UserMessage.from("中国有哪些省请列举3个"))
.messages(UserMessage.from("返回中国古代任意三个朝代"))
.responseFormat(build1)
.build();
@ -51,7 +50,7 @@ public class Json_Example {
*/
interface Assistant {
@SystemMessage("请参考提供资料,不要发散,没有请直接回答未查到")
@SystemMessage("请参考提供资料,不要发散,没有请直接回答没有")
String chat(String userMessage);
}
}
Loading…
Cancel
Save

Powered by TurnKey Linux.