开发
社区收藏缓存设计重构实战
社区收藏业务是一个典型的读多写少的场景,社区各种核心Feeds流都需要依赖用户是否收藏的数据判断,早期缓存设计时由于流量不是很大,未体现出明显的问题,近期通过监控平台等相关手段发现了相关的一些问题,因
EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器
集群管理员往往对整体集群做好了监控运维体系,对于大数据集群,简单的监控运维体系能够帮助管理员在遇到故障的时候定位问题。但对于整体集群的运行效率,集群的状态,通过单纯的监控指标很难给出一个全面的解答。对
ChunJun&OceanBase联合方案首次发布:构建一体化数据集成方案
这是OceanBase&ChunJun联合解决方案的首次发布,将针对分库分表的实时数据集成、跨集群/租户的数据集成、不同数据源的实时数据集成、日志类型数据的全增量一体化处理等诸多场景,提供高可靠数据集
一个技术人“误入歧途”,做了个向量数据库新物种
Created in the name of FOSS.向量数据库公司 Zilliz 近日宣布完成一笔 6000 万美元的 B+ 轮融资,累计融资 1.13 亿美元。这在长于本土的开源创企中,无疑是非
【联通】数据编排技术在联通的应用
欢迎来到【微直播间】,2min纵览大咖观点,本期分享的题目是数据编排技术在联通的应用。本次分享内容将围绕四个方面讲述Alluxio数据编排技术在联通的应用,主要围绕缓存加速、存算分离、混合负载以及轻量
中秋节,华为云AI送上超级大月亮制作教程,体验赢开发者键鼠套装
中秋佳节团圆夜与家人、朋友共赏一轮明月时你还在费力寻找角度拍月亮纠结如何发朋友圈吗快来试试这个魔幻黑科技基于原生视频的AI处理方法一键切换天空背景生成超级大月亮这是一种基于视觉的视频天空替换和协调方法
9篇分布式机器学习系统经典论文;深度学习硬件的黄金十年|AI系统前沿动态
这是OneFlow社区发布 的 第48期AI系统 前沿动态,今天开始正式在OneFlow公众号更新。《AI系统前沿动态》主要推荐AI系统、编译器、大模型、硬件、最新活动等相关内容,每周一期。如果你想了
Hugging Face:成为机器学习界的“GitHub”
来源|The Robot Brains Podcast翻译|程浩源、胡燕君、许涵如、董文文 五年前,AI领域的知名研究者Andrej Karpathy发文称, 传统人工编程属于“软件1.0”,“软件2
终于有人把不同标签的加工内容与落库讲明白了丨DTVision分析洞察篇
·标签如何快速创建和实现标签逻辑的在线化管理·业务人员怎么参与到标签建设流程中·百万级别的标签如何落表当企业无标签系统时,一般由数据开发在离线数仓中完成标签的加工和运行,运营或市场同学需要某个标签需要
基于袋鼠云开源框架的数仓一体化建设探索
会上,袋鼠云大数据引擎开发专家莫问精心准备了一场主题为「袋鼠云开源框架基于数仓的一体化建设探索」的分享,通过“如何围绕数仓一体化建设进行探索”,“引进开源框架后如何解决建设难题”、“开源框架能够带来的
从Core Dump中提取CUDA的报错信息
近期,Meta AI团队在生产PyTorch AI模型时遇到了一个难题。这一问题由CUDA非法内存访问引起,号称集结了Meta全公司最牛的AI工程师才搞定,这篇博客记录了他们使用CUDA的core d
超长序列,超快预测!深势科技联手阿里云,AI 蛋白质预测再下一城
摘要:强强联合,突破 AI 蛋白质预测模型推理性能瓶颈,支持最高 6.6k 长氨基酸序列蛋白质的预测计算,达到目前已知最优推理效果。近日,深势科技与阿里云机器学习 PAI 团队联手,通过全新的蛋白质结
KDD 2022 | 美团技术团队精选论文解读
ACM SIGKDD国际会议(简称 KDD)是由ACM的数据挖掘及知识发现专委会主办的数据挖掘研究领域的顶级年会,属于CCF A类会议。由于KDD的交叉学科性和广泛应用性,其影响力也越来越大,吸引了来
中文稀疏GPT大模型落地 — 通往低成本&高性能多任务通用自然语言理解的关键里程碑
团队:阿里云机器学习平台PAIGPT模型能较好的处理NLP各个应用领域的任务,比如文本分类,推理,对话,问答,完形填空,阅读理解,摘要,生成等等。百亿/千亿参数量级的GPT大模型作用在这些应用领域虽然
Apache DolphinScheduler PMC:开源不一定也要九死一生
参与开源已经快3年了,这次在Meetup上没有分享纯技术的话题,其初衷是想带这大家从一个开源社区维护者的视角来看开源,希望大家能从中获取到一些感悟,当然这次的话题有些观点可能抱有主观看法,大家多多包