1/1 ×

灵光app

官方

系统：Android

版本：v1.2.20.8000

类别：性能优化

日期：2026-07-22

立即下载(206.91MB)

详情
相关
评论

软件介绍

灵光app是由蚂蚁集团官方推出的一款全模态通用AI软件，它集成了AI搜索、对话、聊天、绘画、生图、生视频、创作、P图、学习、翻译、办公、语音等功能，同时还支持语音、文字、图像、3D、图表等多种信息输出方式，满足不同场景需求。

灵光app还可以通过相机镜头来识别并理解现实世界中的场景与内容，实现拍摄即问、实时理解与回答。另外，它还可以生成闪应用，用户只需输入一段描述词，灵光便能在30秒内为其生成一款功能完整的、可交互的AI小应用。

灵光app上手指南

从回答到表达，AI 也需要信息美学

灵光的落地页是熟悉的对话窗口，只需要用自然语言发起请求，比如「告诉我这罐饮料的热量」或「记录一下今天的饮食摄入」，极大地降低了上手时的学习成本，也让整个 App 显得比传统应用更流动。

看起来还是像聊天对话啊？其实，跟灵光的每一句对话，对它而言都是一次行动。下面是三个你很可能也会用到的真实例子。

最近因为全运会，广州也享受了一把网红城市的待遇，尤其是广州塔，每天都被游客包围。我问了灵光，「广州塔在建筑设计上有何特别之处？」它返送的不只是文字说明，还带上了一个可交互的 3D 建筑模型。

可以旋转、可以拉近看结构细节，可交互的形式让我清晰直观地感受到了广州塔双面扭转结构、斜交网状外筒的设计语言。

在和灵光的对话中，它不仅能告诉你答案「是什么」，还能让你看到答案「长什么样」。文本、图像、结构动画都整合在一起，整个问答体验，就像在对话里放进了一个实时生成的「解说图文」。不管是建筑专业学生、城市爱好者，甚至只是出于兴趣想多了解这座地标，都能真的省下了你一点点搜索、翻页、拼凑资料的时间。

紧接着，我补充了一个追问「那帮我规划一个附近的美食打卡行程吧」，它马上理解这个「附近」是广州，并直接生成了一张可缩放的交互地图，标注了六七家风格不同的小店，甚至还有「隐藏路线」。每个点位都能点开看推荐理由、评分、营业时间，甚至还顺带估算了步行路线。

惊人，直接在手机上就能生成可以交互的内容展示，放眼整个行业也并不多见。

如果说这两个案例是让人感受到「好看、酷炫」，那接下来要展示的，是灵光的「理性美」。

对于一个优秀的通用 AI 助手来说，一问一答显然是不够的，而是要能实现结构化的输出，也就意味着需要对信息语义的深度理解和再组织——不仅是检索信息，更能提炼信息点，智能理解语义并进行分层。

比如，碰到「为什么消费品牌正在出售中国区业务/为什么拟物风格的 UI 设计会退潮？」这些既需要宏观视野，也需要微观分析的问题，灵光的回应方式并不依赖大段大段的文字，而是先拆解出关键因素——如消费市场变化、品牌生命周期、股东压力等——再依此组织内容输出，形成一组因果清晰、逻辑递进的解释结构。

以标题+概括的卡片式风格，镶嵌在一个完整的图文里，可以避免枯燥，又不像 PPT/网页报告那样冗长无重点。这样的结构化输出不仅逻辑清晰，也在视觉上展现出一种「信息美学」：干净、聚焦、节奏舒适，不仅让信息吸收更高效，也模拟了专家型写作者的内容组织方式，让 AI 输出更像一份「讲得通」的深度内容，远不仅是「查得到」的浅层答案。

你可能已经想了一路了：这到底是怎么做到的？为什么能既结构清晰，又视觉友好，还能实时互动？

其实在接收到问题时，灵光会调动一套以代码生成为核心的内容创建流程。无论是图文、地图还是 3D 动画，底层都是由模型即时写出对应代码、样式和组件，再动态拼装呈现出来。要完成这些工作，并不是由一个大模型孤军奋战，而是由多个智能体协作实现：有的负责图像，有的负责布局，有的调取数据结构……像搭积木一样。

既整合不同内容体裁，又能适配常见的内容呈现方式，从而给出极其自然的内容。最终实现的效果，也更适合转发、截图、总结成「朋友圈可用」的内容——既有理性判断，又能传递个人观点和情绪。

一句话、30 秒，给自己做个 App

如果说对话中能做图、做路线规划已经够神奇，那么接下来的能力接近「魔法」：用键盘敲一句需求，它就能直接帮你把一个小 App 搭好。

用 agent 生成应用，现在处于一个比较尴尬的位置：很多应用总是卡在「能理解、不能执行」的断点上。而灵光的「闪应用」瞄准的就是这个痛点，对话已经超越调用和请求工具的步骤，能够做到直接生成工具。

是的，不是生成一段代码、一个原型、一个建议，而是原地生成一个「即刻能用的工具」。实现想法终于不再是程序员专属的快乐，闪应用可以给每个普通人亲手「造东西」一个起点。

来看看它是怎么让「想法落地」变得这么轻巧的：我给它的第一个任务是，「我想要一个能把长文本拆分成更小段落的工具」。

仅仅 30 秒，一个可以设置段落数、自动分段文件的小工具就出现了，甚至不需要打开新页面，它会将生成结果直接嵌在对话流中，点开即用。

再来一个轻巧又实用的例子：做一个菜单翻译器，这里的要义在于，既能把外语菜名翻译成中文让我知道是什么，又能原样朗读出外语，方便我点菜。

理解文字，生成语言，组织界面，并且用声音反馈——这些能力以前得靠多个组件组合才能实现，可能还需要我详细解释代码逻辑，现在只用一句话，它就全都打包完成。

无论是出国旅行用来点菜，还是练习口语用来熟悉菜名表达，这样的小工具一经生成就能上手，把翻译、语音合成这些动态模块全都集成进来，真正做到了「即做即用」。

这背后是一套完整的应用构建：不仅能输出前端页面，还能一并调用大模型的后端能力。不仅给你实现了代码，还免费给你上 UI 设计。这样一来，生成出来的成品就不只是个 demo，而是真的能与用户实时互动、响应输入，具备完整的前后端逻辑闭环。

与其花时间翻遍整个应用商店，拿闪应用一分钟做一个完全贴合我个人需求的小工具，显然更快也更好。灵活、即时、零门槛。它不是通用解法，而是「为这一次定制」的临时小解决方案，却能激发普通人对「创造」的心理满足感——哪怕不懂开发，也能凭一句自然语言体验「自己做了个小应用」的快乐和分享冲动。

带着「眼睛」展开互动

实时视频已经是目前 AI 助手的「标准配置」了，灵光给这个功能起了个相当有创意的名字：开眼。还真挺贴切，不是靠打字输入，而是打开摄像头，如同给 AI 打开了眼睛，接受另一种自然语言：视觉语言。

比如举起手机对准一杯奶茶，屏幕上马上浮现出饮食建议、保存注意事项，还带着几个延展提问，满足你的好奇心：

这个功能在食品药品上非常方便，无论是给自己选，还是给父母买了新产品他们却不认识时，灵光开眼正好能大展身手。

开眼的特点在于，通过流式识别，超越简单的「认得一个东西」，而是变成了能做出响应、展开对话的智能视觉入口。它能理解你此刻潜在的意图，主动发起跟进动作，把一次镜头下的识别。变成一套连贯的行为链条。

比起那些只能识别 Logo 或商品的旧时代 AI 视觉，它明显走得更远了一步：不仅识别是什么，还试图理解你为什么看它、接下来可能需要什么。

也就是说，它把「摄像头」变成了另一个对话渠道，一种通过视觉引导交互的对话，真正意义上的「开眼」：带着「眼睛」展开互动。

软件特色

● 灵光对话—— 让知识“活”起来

只需要输入问题或者关键词，灵光即可通过以下形式为你提供可视化的答案；

【语音朗读】英文单词、生僻字发音、睡前故事，都能即时转化为自然流畅的语音。

【3D数字模型】运用前沿三维数字化技术，打破平面界限，实现交互式探索。

【生成式插图】让信息拥有专属视觉语言，化繁为简，直观呈现为图像或动画。

【图表与数据】秒懂复杂数据，财报、研究论文等一目了然。

【可交互地图】为你直接生成地图，帮你清晰规划路径与动线，查询位置信息。

【解读和溯源】支持在一个对话中针对答案进一步深度解读和查看来源。

● 灵光开眼—— 你的智能“探索之眼”

赋予你的手机一双能理解、会思考、懂创作的智能探索之眼，支持文生图、文生视频、图生图、图生视频等多种创作玩法。

【实时理解】实时理解复杂场景动态画面，支持语音双向交互问答。

【看图提问】上传图片自由提问。

【自由创作】指令修图改图，一句话即可生成视频和图片。

更新日志

v1.2.20.8000版本

优化产品体验&稳定性

软件信息

包名：com.antgroup.leopard.android
MD5：129878CA4B9C1A04A5B739783666CF96
厂商：支付宝（杭州）数字服务技术有限公司
权限：查看
备案号：浙ICP备16025414号-273A
隐私：查看

其他软件

换一换

网友评论

需要授予该应用的权限X

改变WiFi状态
改变WiFi状态
-------------------------------------
获取网络状态
获取网络信息状态,如当前的网络连接是否有效
-------------------------------------
修改声音设置
修改声音设置信息
-------------------------------------
写入外部存储
允许程序写入外部存储,如SD卡上写文件
-------------------------------------
录音
录制声音通过手机或耳机的麦克
-------------------------------------
使用证书
允许程序请求验证从AccountManager
-------------------------------------
使用振动
允许振动
-------------------------------------
获取精确位置
通过GPS芯片接收卫星的定位信息,定位精度达10米以内
-------------------------------------
使用闪光灯
允许访问闪光灯
-------------------------------------
获取粗略位置
通过WiFi或移动基站的方式获取用户错略的经纬度信息,定位精度大概误差在30~1500米
-------------------------------------
获取任务信息
允许程序获取当前或最近运行的应用
-------------------------------------
获取WiFi状态
获取当前WiFi接入的状态以及WLAN热点的信息
-------------------------------------
唤醒锁定
允许程序在手机屏幕关闭后后台进程仍然运行
-------------------------------------
访问网络
访问网络连接,可能产生GPRS流量
-------------------------------------
读写系统设置
允许读写系统设置项
-------------------------------------
连续广播
允许一个程序收到广播后快速收到下一个广播
-------------------------------------
小米服务
小米推送服务Client端SDK
-------------------------------------
小米服务
小米推送服务Client端SDK
-------------------------------------
拍照权限
允许访问摄像头进行拍照
-------------------------------------
访问外部存储
访问外部存储的权限
-------------------------------------
改变网络状态
改变网络状态如是否能联网
-------------------------------------
状态栏控制
允许程序扩展或收缩状态栏
-------------------------------------
转存系统信息
允许程序获取系统dump信息从系统服务
-------------------------------------
排序系统任务
重新排序系统Z轴运行中的任务
-------------------------------------