行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递

谷歌(GOOGL.US)更新Gemini API定价 按推理使用分档计费

智通财经 04-03 14:13

谷歌A --%

智通财经APP获悉,谷歌(GOOGL.US)近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。

本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。

谷歌表示:“Gemini API提供多种优化机制,可根据具体业务负载需求,在运行速度、使用成本与服务稳定性之间实现平衡。无论是搭建实时对话机器人,还是运行大型离线数据处理流程,选择合适的运行模式都能显著降低成本或提升运行效率。”

其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为1至15分钟,但不提供延迟保证。批量API档位同样提供标准费率五折优惠,延迟最长可达24小时。

缓存档位计费依据缓存词元(Token)数量与存储时长,推荐用于搭载复杂系统指令的对话机器人、长视频文件重复分析,以及大规模文档集查询等场景。

优先档位定价则比标准价格高出75%至100%,延迟可控制在毫秒至秒级。谷歌建议该档位用于实时客服聊天机器人、实时欺诈检测及业务关键型智能助手等场景。

免责声明:用户发布的内容仅代表其个人观点,与九方智投无关,不作为投资建议,据此操作风险自担。请勿相信任何免费荐股、代客理财等内容,请勿添加发布内容用户的任何联系方式,谨防上当受骗。

举报

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈