字节跳动共8篇
火山引擎Dataleap治理实践:如何降低数仓建设成本_黑猫博客

火山引擎Dataleap治理实践:如何降低数仓建设成本

存储与计算资源是数仓建设的基础,也是数仓建设中的重要成本支出。而随着数仓建设规模逐渐扩大、时间跨度逐渐拉长,将不可避免的出现数据表、任务、字段的冗余。
黑猫的头像_黑猫博客黑猫9个月前
0407
字节跳动基于 Hudi 的机器学习应用场景_黑猫博客

字节跳动基于 Hudi 的机器学习应用场景

为了让大家更容易理解接下来要讲的基于数据湖的样本存储和样本生成问题,文章先给大家简单介绍一些相关的基础概念。首先是机器学习系统的离线数据流架构,机器学习系统和其他线上服务系统类似,...
黑猫的头像_黑猫博客黑猫9个月前
03310
HTTP框架Hertz实践入门:性能测试指南_黑猫博客

HTTP框架Hertz实践入门:性能测试指南

本文旨在分享开发者在压测 Hertz 时需要了解的场景和技术问题。这些建议有助于用户更好地结合真实 HTTP 场景对 Hertz 进行调优,使之更贴合业务需要、发挥较高性能。用户也可以参考官方提供的压...
黑猫的头像_黑猫博客黑猫11个月前
04514
字节跳动数据中台的Data Catalog系统搜索实践_黑猫博客

字节跳动数据中台的Data Catalog系统搜索实践

Data Catalog 能够帮助大公司更好地梳理和管理自己的资产,是 Data-drvien 公司的重要平台。一个通用的 Data Catalog 平台通常包含元数据管理,搜索,血缘,标签,术语等功能。在字节跳动数据中...
黑猫的头像_黑猫博客黑猫11个月前
0346
突破etcd限制 字节自研K8s存储KubeBrain_黑猫博客

突破etcd限制 字节自研K8s存储KubeBrain

KubeBrain 是字节跳动针对 Kubernetes 元信息存储的使用需求,基于分布式 KV 存储引擎设计并实现的取代 etcd 的元信息存储系统,支撑线上超过 20,000 节点的超大规模 Kubernetes 集群的稳定运行...
黑猫的头像_黑猫博客黑猫11个月前
03411
字节跳动 YARN 云原生化演进实践_黑猫博客

字节跳动 YARN 云原生化演进实践

字节跳动内部离线业务具有庞大的规模,线上每天有数十万节点运行,每天的任务数达到百万量级,每天使用的资源量达到千万核量级。在如此庞大的计算规模下,为了能够高效地处理任务,提高资源流转...
黑猫的头像_黑猫博客黑猫11个月前
08214
字节跳动数据湖在实时数仓中的实践_黑猫博客

字节跳动数据湖在实时数仓中的实践

本节我们讨论的是字节实时数仓场景的初探以及遇到的问题和解决方案。坦白地讲,在最初落地时大家对数据湖能支持线上生产的态度都是存疑的,我们开始的方案也就比较保守。我们首先挑选一些对比现...
黑猫的头像_黑猫博客黑猫11个月前
0526
veImageX演进之路:iOS高性能图片加载SDK_黑猫博客

veImageX演进之路:iOS高性能图片加载SDK

本文就来介绍下 iOS 客户端图片加载 SDK(下文中简称 SDK),SDK 主要提供图片网络加载、图像解码、图片基础处理与变换以及图片服务质量监控上报等能力。
黑猫的头像_黑猫博客黑猫11个月前
05611