|
人工智能
|

LongAlign:港大推出的提升文本到图像扩散模型处理长文本对齐方法

LongAlign是由香港大学研究团队推出的文本到图像扩散模型的改进方法,旨在提升长文本输入的对齐精度。通过段级编码技术和分解偏好优化,LongAlign显著提高了模型在长文本对齐任务上的性能,超越了现有的先进模型。

251 1
来自: 自然语言处理  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

LTX Video:Lightricks推出的开源AI视频生成模型

LTX Video是由Lightricks推出的开源AI视频生成模型,能够在4秒内生成5秒的高质量视频。该模型基于2亿参数的DiT架构,确保帧间平滑运动和结构一致性,支持长视频制作,适用于多种场景,如游戏图形升级和电子商务广告变体制作。

1233 1
来自: 计算机视觉  版块
|
存储 人工智能 自然语言处理
|

OpenScholar:华盛顿大学联合艾伦研究所开源的学术搜索工具

OpenScholar是由华盛顿大学和艾伦AI研究所联合开发的开源学术搜索工具,旨在通过检索和综合科学文献中的相关论文来回答用户问题。该工具利用大规模科学论文数据库、定制的检索器和重排器,以及一个优化的8B参数语言模型,生成基于实际文献的准确回答。OpenScholar在提供事实性回答和准确引用方面超越了现有的专有和开源模型,所有相关代码和数据均已开源,支持并加速科学研究。

826 1
来自: 自然语言处理  版块
|
人工智能 编解码
|

OmniBooth:华为诺亚方舟联合港科大推出的图像生成框架

OmniBooth是由华为诺亚方舟实验室和港科大研究团队联合推出的图像生成框架,支持基于文本提示或图像参考进行空间控制和实例级定制。该框架通过用户定义的掩码和相关联的文本或图像指导,精确控制图像中对象的位置和属性,提升文本到图像合成技术的可控性和实用性。

222 1
来自: 计算机视觉  版块

java 中 IO 流

Java中的IO流是用于处理输入输出操作的机制,主要包括字节流和字符流两大类。字节流以8位字节为单位处理数据,如FileInputStream和FileOutputStream;字符流以16位Unicode字符为单位,如FileReader和FileWriter。这些流提供了读写文件、网络传输等基本功能。

253 10
|
人工智能 自然语言处理 Swift
|

探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!

阿里国际AI团队发布的新模型Marco-o1,不仅擅长解决具有标准答案的学科问题(如代码、数学等),更强调开放式问题的解决方案。该模型采用超长CoT数据微调、MCTS扩展解空间等技术,提升了模型在翻译任务及复杂问题解决上的表现。研究团队还开源了部分数据和模型,供社区使用和进一步研究。

1050 1
|
人工智能 自然语言处理 物联网
|

魔搭社区每周速递(11.17-11.23)

魔搭ModelScope本期社区进展:923个模型,85个数据集,35个创新应用,7 篇内容

360 3
|
JavaScript 计算机视觉
|

FLUX.1 Tools 全家桶开源!文末附一键ComfyUI启动链接

Black Forest Labs 发布了 FLUX.1 Tools,一套增强 FLUX.1 文本转图像模型的工具集,包括 FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny 和 FLUX.1 Redux,分别用于图像修复、深度引导、边缘检测和图像重组。提供详细的安装指南和模型下载链接,支持用户快速上手并优化图像处理流程。

4843 4
|
数据采集 人工智能 自然语言处理
|

关于大模型语料的迷思

随着大模型发展的不断深入,我们越来越关注到语料质量对模型能力的影响,语料中的偏差和主观性会导致生成内容不准确或带有偏见。智能引擎事业部是阿里内部深耕多年的AI工程团队,为内部业务提供了完整的大模型工程体系,持续关注大模型训推性能、成本、研发范式等关键问题。本文将基于我们的思考,探讨大模型语料的复杂性及其背后的思维过程。

549 1
来自: 自然语言处理  版块
|
人工智能 自然语言处理 前端开发
|

VideoChat:高效学习新神器!一键解读音视频内容,结合 AI 生成总结内容、思维导图和智能问答

VideoChat 是一款智能音视频内容解读助手,支持批量上传音视频文件并自动转录为文字。通过 AI 技术,它能快速生成内容总结、详细解读和思维导图,并提供智能对话功能,帮助用户更高效地理解和分析音视频内容。

1063 6
来自: 自然语言处理  版块
|
人工智能 数据可视化 API
|

AI Agents Loop异步执行可视化Tutorial 借助AgentBoard工具可视化工作流

本文介绍了AI Agent的异步执行循环(Agent Loop),并展示了如何利用开源框架agentboard可视化这一过程。通过分析不同框架(如AutoGen、LangGraph、AutoAgent)对Agent Loop的抽象,文章详细说明了从简单的功能调用到复杂的多阶段执行流程的设计。此外,还提供了使用agentboard进行日志记录与流程可视化的具体示例,包括安装步骤、代码实现及运行方法,帮助开发者更高效地调试和优化AI Agent的应用。

1145 4
来自: 多模态  版块
|
人工智能 物联网 Shell
|

今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用

本文介绍了多个开源项目,涵盖了从量子计算错误纠正到视频生成和编辑的广泛应用领域。这些项目展示了AI技术在不同领域的创新和应用潜力。

990 10
|
人工智能 安全 JavaScript
|

Open Interpreter:AI 赋能终端!在终端中对话AI模型进行编程,通过运行代码来完成各种计算机操作任务

Open Interpreter 是一个让语言模型运行代码的强大工具,提供了一个类似 ChatGPT 的界面,支持多种编程语言和丰富的功能。

1009 7
来自: 自然语言处理  版块
|
人工智能 Shell iOS开发
|

AI Shell:在命令行里“对话” AI ,微软推出将 AI 助手引入命令行的 CLI 工具,打造对话式交互命令行

AI Shell 是一款强大的 CLI 工具,将人工智能直接集成到命令行中,帮助用户提高生产力。AI Shell 支持多种 AI 模型和助手,通过多代理框架提供丰富的功能和灵活的使用模式。

2075 7
来自: 自然语言处理  版块
|
人工智能 自然语言处理 搜索推荐
|

浪潮信息 Yuan-embedding-1.0 模型登顶MTEB榜单第一名

浪潮信息Yuan-Embedding-1.0模型在C-MTEB评测基准中荣获Retrieval任务第一名,推动中文语义向量技术发展

2323 7
|
SQL 机器学习/深度学习 人工智能
|

今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!

本文介绍了四个最新的 AI 开源项目,涵盖多模态生成式 AI、自然语言到 SQL 转化、多模态数学推理和复杂逻辑推理等多个领域,为 AI 应用开发提供了丰富的资源和工具。

875 0
来自: 自然语言处理  版块
|
自然语言处理 API C++
|

阿里通义推出SmartVscode插件,自然语言控制VS Code,轻松开发应用,核心技术开源!

SmartVscode插件深度解析:自然语言控制VS Code的革命性工具及其开源框架App-Controller

2096 1
|
机器学习/深度学习 人工智能 缓存
|

最佳实践!使用 GraphRAG + GLM-4 对《红楼梦》全文构建中文增强检索

特别介绍`graphrag-practice-chinese`项目,这是一个针对中文优化的GraphRAG应用实例,通过改进文本切分策略、使用中文提示词及选择更适合中文的模型等手段,显著提升了处理中文内容的能力。项目不仅包括详细的搭建指南,还提供了《红楼梦》全文的索引构建与查询测试示例,非常适合个人学习和研究。

2432 1
来自: 自然语言处理  版块
|
Web App开发 人工智能 自然语言处理
|

WebChat:开源的网页内容增强问答 AI 助手,基于 Chrome 扩展的最佳实践开发,支持自定义 API 和本地大模型

WebChat 是一个基于 Chrome 扩展开发的 AI 助手,能够帮助用户理解和分析当前网页的内容,支持自定义 API 和本地大模型。

1338 1
来自: 自然语言处理  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据

Documind 是一款利用 AI 技术从 PDF 中提取结构化数据的先进文档处理工具,支持灵活的本地或云端部署。

660 8
来自: 多模态  版块
|
人工智能 开发框架 搜索推荐
|

今日 AI 开源|共 10 项| 复合 AI 模型,融合多个开源 AI 模型组合解决复杂推理问题

今日 AI 简报涵盖多项技术革新,包括多模态检索增强生成框架、高保真虚拟试穿、视频生成、生成式软件开发、上下文感知记忆管理等,展示了 AI 在多个领域的广泛应用和显著进步。

806 10
|
存储 人工智能 搜索推荐
|

Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库

Memoripy 是一个 Python 库,用于管理 AI 应用中的上下文感知记忆,支持短期和长期存储,兼容 OpenAI 和 Ollama API。

969 6
来自: 自然语言处理  版块
|
人工智能 搜索推荐 API
|

Perplexica:开源 AI 搜索引擎,Perplexity AI 的开源替代品,支持多种搜索模式、实时信息更新

Perplexica 是一款开源的 AI 驱动搜索引擎,支持多种搜索模式和实时信息更新,适用于个人、学术和企业等不同场景。

1318 6
来自: 自然语言处理  版块
|
人工智能 API
|

OmniSearch:阿里巴巴通义推出的多模态检索增强生成框架

本文介绍了阿里巴巴通义实验室推出的多模态检索增强生成框架 OmniSearch,该框架具备自适应规划能力,能够动态拆解复杂问题,根据检索结果和问题情境调整检索策略,从而提升检索效率和准确性。

1201 5
来自: 多模态  版块
|
物联网 Swift Python
|

基于qwen模型实现大模型应用探索-党务知识小助手

本项目基于qwen2-7b-instruct模型,采用LoRA技术,在党务知识数据集与通用数据集上进行微调,专为党务领域问答设计,涵盖党员教育等场景。通过数据准备、模型微调、推理测试及部署应用。

806 0
|
算法 物联网 开发者
|

In-Context LoRA实现高效多任务图像生成,开启视觉创作新篇章

这篇文章介绍了通义实验室提出的In-Context LoRA,这是一种基于现有文本到图像模型的任务无关性框架,用于实现高质量的多任务图像生成。

2209 11
|
缓存 负载均衡 Java
|

Java“TimeoutException”解决

Java中的“TimeoutException”通常在操作超时未完成时抛出。解决方法包括:增加超时时间、优化代码逻辑减少执行时间、使用异步处理或线程池提高效率。

1685 11
|
前端开发 JavaScript 测试技术
|

Google提出的网页性能评价指标

Google推出的“网页指标”计划旨在优化网页用户体验,其中Core Web Vitals为核心指标,包括Largest Contentful Paint (LCP)、Interaction to Next Paint (INP)和Cumulative Layout Shift (CLS),分别衡量加载速度、互动性和视觉稳定性。这些指标采用第75百分位数评估,确保在不同设备和网络环境下提供一致的用户体验。

693 5
|
算法 人机交互 UED
|

响应时间指标的探索

本文探讨了响应时间在人机交互中的重要性及发展。从1968年Rober B.Miller首次定义响应时间的多个维度,到1991年Stuart K.Card等人提出的立即响应时间常数,再到1993年Jakob Nielsen将响应时间划分为三个关键阈值,直至2020年Google提出的RAIL模型,强调了以用户为中心的性能衡量标准。这些研究为提升用户体验提供了理论基础和技术指导。

1310 5
|
XML 测试技术 数据格式
|

Jacoco的XML报告详解

JaCoCo的XML报告详解:本文介绍了使用JaCoCo生成的XML格式的测试覆盖率报告,包括报告结构、DTD文件定义、counter计数器及其类型(如INSTRUCTION、BRANCH等)、以及package、class、method、sourcefile等元素的具体内容和作用。通过这些信息,开发者可以详细了解测试代码的覆盖率情况,从而优化测试策略。

874 5
|
存储 安全 虚拟化
|

虚拟化技术:实现资源高效利用和灵活管理的利器

虚拟化技术作为实现资源高效利用和灵活管理的重要手段,在数字化时代背景下,正逐步改变传统IT架构模式。本文概述了虚拟化技术的概念、原理及其在数据中心管理、云计算平台、企业信息化建设、科研教育及医疗行业的应用,并探讨了其面临的挑战与未来发展趋势。

717 3
|
Java 开发者
|

Java“NoSuchElementException”问题解决

“NoSuchElementException”是Java编程中常见的异常之一,通常发生在尝试从集合或迭代器中获取不存在的元素时。本文将介绍该异常的原因、常见场景及解决方法,帮助开发者有效应对这一问题。

1082 5
|
机器学习/深度学习 算法
|

魔搭案例开源获奖

赵卫东老师在第七届CCF开源创新大赛教学案例赛道中荣获特等奖。他的案例设计注重理论与实践结合,采用阿里魔搭平台和英特尔OpenVINO等先进技术,提升课程的实用性与前瞻性。该案例已开源,并在教学中取得显著成效。赵卫东老师一直坚持“学以致用、产教融合”的理念,多次在教学比赛中获奖。

441 7
|
存储 Kubernetes 调度
|

如何驱逐某个节点上到某些名称空间的pod到其他节点

在 Kubernetes (k8s) 中,驱逐某个节点上特定命名空间的 Pod 到其他节点可以通过以下步骤实现: ### 步骤一:找到要驱逐的 Pod 首先,你需要找到位于特定命名空间并且运行在目标节点上的 Pod。你可以使用 `kubectl get pods` 命令并指定 `-o wide` 和 `--namespace` 参数来获取这些信息。 ```bash kubectl get pods -o wide --namespace=<your-namespace> ``` 此命令将返回指定命名空间中的所有 Pod,并显示它们的详细信息,包括所在的节点名称。 ### 步骤二:标记

1340 4
|
传感器 物联网 定位技术
|

低功耗蓝牙

低功耗蓝牙(Bluetooth Low Energy,简称BLE)是一种无线通信技术,专为低功耗应用设计。它在保持蓝牙无线连接的同时,大幅降低了能耗,适用于各种小型设备和传感器,如智能手环、健康监测器等。

1000 2

图片修复

该技术在图片重新上色和色彩增强方面表现突出,图像去噪效果也很好。如果能加入人像增强功能以提升清晰度,将更加完美。

282 0
来自: 计算机视觉  版块

图篇修复

该技术在图像重新上色和色彩增强方面表现突出,同时也能有效去除图像噪声,若加入人像增强功能将更加完美。

153 0
|
存储 前端开发 数据可视化
|

在实际项目中,如何选择使用 Flux 架构或传统的 MVC 架构

在实际项目中选择使用Flux架构或传统MVC架构时,需考虑项目复杂度、团队熟悉度和性能需求。Flux适合大型、高并发应用,MVC则适用于中小型、逻辑简单的项目。

295 6
|
TensorFlow 算法框架/工具 Swift
|

魔搭的notebook再次打开时swift导入失败

每次重新打开Notebook时,系统会显示一系列警告和错误信息。主要问题是当前安装的Keras版本为Keras 3,而Transformers库尚不支持该版本。解决方法是安装与Transformers兼容的`tf-keras`包,命令为`pip install tf-keras`,但pip后仍然报错

574 22
|
自然语言处理 Python
|

如何使用自然语言处理库`nltk`进行文本的基本处理

这段Python代码展示了如何使用`nltk`库进行文本的基本处理,包括分词和词频统计。首先需要安装`nltk`库,然后通过`word_tokenize`方法将文本拆分为单词,并使用`FreqDist`类统计每个单词的出现频率。运行代码后,会输出每个词的出现次数,帮助理解文本的结构和常用词。

369 1
来自: 自然语言处理  版块
|
存储 监控 安全
|

开发者的黄金时代:原生鸿蒙应用市场的全生命周期服务

2024年10月22日,华为发布了HarmonyOS NEXT,标志着鸿蒙生态进入商用发展阶段。原生鸿蒙应用市场全面焕新,不仅在UI设计、互动体验和隐私安全机制上进行了重塑,还为开发者和用户提供了从开发到分发的全生命周期服务。通过统一上架、多端分发、隐私合规保障等措施,原生鸿蒙应用市场助力开发者实现高效、安全的应用开发与分发,为全球数亿鸿蒙用户带来更流畅、更安全的使用体验。

750 1
|
JSON 文字识别 自然语言处理
|

转发文章

通过文档智能(Document Mind)解析文档支撑检索增强生成RAG 通过文档智能(Document Mind)将文档解析为结构化数据,结合语义理解,提取出文档层级树、样式信息以及版面信息,下游将解析的结果数据处理成文档切片,生成切块(Chunk)数据。 如图所示,文档智能支持将非结构化文档内容提取的信息输出为Markdown和Json格式,更方便构建语义分块策略。 解决问题:文档内容解析错误,相较于传统单页以电子解析文本或者OCR解析文本的方式,IDP则针对不同的文档类型,实现电子解析+OCR/NLP的细粒度混合版融合方案,通过电子解析+OCR/NLP中互相的优缺点弥补,提升解析的

182 4
|
Linux 数据库
|

find、locate和grep命令对比

在Linux系统中,`find`、`locate`和`grep`命令各有特点。`find`通过递归遍历文件系统,适合复杂条件搜索;`locate`通过预建数据库快速查找文件,但依赖数据库更新;`grep`用于文件内文本搜索,可结合`find`提高效率。选择合适的命令需根据具体需求和场景。

337 2
|
Linux 数据库
|

linux 全局搜索文件

在 Linux 系统中,全局搜索文件常用 `find`、`locate` 和 `grep` 命令。`find` 根据文件名、类型、大小、时间戳等条件搜索;`locate` 通过预构建的数据库快速查找文件;`grep` 在文件中搜索特定文本,常与 `find` 结合使用。选择合适的命令取决于具体需求。

2669 2
|
人工智能 运维 自然语言处理
|

对话蚂蚁开源蒋炜:让 Agent 把运维人员从 24 小时的待命中解放出来

当整个行业的智慧都集中在一件事情上时,比起闭门造车,开源一定能带来更好的技术迭代和发展。CodeFuse 「编码挑战季」活动火热进行中,诚邀广大开发者们参与编码挑战

748 3
|
SQL 人工智能 自然语言处理
|

2024年代码大模型论文精选第五期

本文整理了2024年9月至10月中旬全球各大高校与科研机构发布的70篇代码大模型相关论文,涵盖基座模型、代码微调、测试基准、代码Agent、代码生成、SQL生成、漏洞检测与修复等多个主题。文章详细介绍了各篇论文的主要内容和创新点,并提供了链接和发布机构信息。全文篇幅较长,建议电脑端阅读。若想了解更多相关内容,可关注我们的代码大模型综述和GitHub开源项目。

1089 0
|
缓存 人工智能 程序员
|

活动|2024 CodeFuse 「编码挑战季」活动已开启!欢迎报名参加

1024程序员节,CodeFuse发起「编码挑战季」活动,邀请开发者参与muAgent、MFTCoder、ModelCache、CodeFuse-IDE四个项目的编码挑战。活动设有多难度任务,完成即可获积分兑换礼品,更有神秘大奖等你来拿!详情及报名请访问CodeFuse官方渠道。

267 1
|
人工智能 自然语言处理 IDE
|

CodeFuse IDE 0.6 版本发布,支持编辑器诊断问题 AI 修复

CodeFuse IDE 是基于蚂蚁自研大模型和 OpenSumi 框架的 AI 编程助手,支持多语言,提供代码建议、解释、测试生成等,增强开发效率。最新版增加 AI 修复和智能补全功能,开源并支持 VS Code 插件生态。[了解更多](https://github.com/codefuse-ai/codefuse-ide)

804 0
|
C语言
|

C语言:哪些情况下会出现野指针

C语言中,野指针是指指向未知地址的指针,通常由以下情况产生:1) 指针被声明但未初始化;2) 指针指向的内存已被释放或重新分配;3) 指针指向局部变量,而该变量已超出作用域。使用野指针可能导致程序崩溃或不可预测的行为。

333 1
|
前端开发 开发者
|

css两种盒子模型

在CSS中,有两种盒子模型:标准盒子模型和IE盒子模型(怪异盒子模型)。标准盒子模型中,`width`和`height`仅指内容区的尺寸,总宽度和高度还包括内边距、边框和外边距。IE盒子模型中,`width`和`height`包括内容区、内边距和边框,总宽度和高度仅加外边距。通过`box-sizing`属性可以切换这两种模型,`box-sizing: content-box;`表示标准盒子模型,`box-sizing: border-box;`表示IE盒子模型。

270 2

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15090
内容
6
活动
3970
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互