LightGBM相关知识介绍2
lightGBM专栏, 上海市, 2024
同XGBoost类似,LightGBM依然是在GBDT算法框架下的一种改进实现,是一种基于决策树算法的快速、分布式、高性能的GBDT框架,主要说解决的痛点是面对高维度大数据时提高GBDT框架算法的效率和可扩展性。
lightGBM专栏, 上海市, 2024
同XGBoost类似,LightGBM依然是在GBDT算法框架下的一种改进实现,是一种基于决策树算法的快速、分布式、高性能的GBDT框架,主要说解决的痛点是面对高维度大数据时提高GBDT框架算法的效率和可扩展性。
lightGBM专栏, 上海市, 2024
LightGBM在Higgs数据集上LightGBM比XGBoost快将近10倍,内存占用率大约为XGBoost的1/6,并且准确率也有提升。GBDT在每一次迭代的时候,都需要遍历整个训练数据多次。如果把整个训练数据装进内存则会限制训练数据的大小;如果不装进内存,反复地读写训练数据又会消耗非常大的时间。尤其面对工业级海量的数据,普通的GBDT算法是不能满足其需求的。
Xgboost专栏, 上海市, 2024
本文不讲如何使用 XGBoost 也不讲如何调参,主要会讲一下作为 GBDT 中的一种,XGBoost 的原理与相关公式推导。为了循序渐进的理解,读者可先从简单的回归树再到提升树再来看本文。我们现在直接从 XGBoost 的目标函数讲起。
lightGBM专栏, 上海市, 2024
Light GBM 代表轻量级梯度提升机,因此,它是另一种使用基于树的学习的梯度提升算法,由微软开发: 与任何其他梯度提升算法一样,它主要用 C++ 实现。此外,它还可以与许多其他扩展(Python、R、Java 等)交互。 由于某些独特的特点,它与其他梯度提升算法区别开来。
lightGBM专栏, 上海市, 2024
LightGBM是微软于2016年开发的梯度提升决策树模型(GBDT),与其他GBDT模型相比,LightGBM的最大特点是训练效率更快、准确率更高。
Xgboost专栏, 上海市, 2024
XGBoost(eXtreme Gradient Boosting)是一个高效的机器学习库,也是一种基于梯度提升决策树(Gradient Boosting Decision Tree)的集成学习算法,专为提升树算法的性能和速度而设计。它实现了梯度提升框架,并支持回归、分类及排序的问题。XGBoost通过优化计算资源使用和提供高度可配置的参数,成为数据科学竞赛和实际应用中的热门选择。
优化, 上海市, 2023
供应链存在的主要问题是牛鞭效应非常严重。牛鞭效应是指上游的一些波动经过层层传导,到下游会逐级放大,波动越到后端的需求侧的变化幅度会越大。因此,对于供应链预测,我们所要面对的一个问题就是如何最大限度地减小需求波动对这些决策质量的影响。如果能做到这一点,其实就决定了整个供应链的成本、效率和服务水平。
Xgboost专题, 上海市, 2023
XGBoost 最初是由 Tianqi Chen 作为分布式(深度)机器学习社区(DMLC)组的一部分的一个研究项目开始的。XGBoost后来成为了Kaggle竞赛传奇——在2015年的時候29个Kaggle冠军队伍中有17队在他们的解决方案中使用了XGboost。
优化, 上海市, 2023
基于订单大数据,计算出最合适的箱型和长宽高,从而优化纸箱型号、减少包材浪费;根据订单的物件体积、重量以及特性,推荐最合适的箱型和装箱方案。如此一来,大小合适的箱子不仅可以减少商品与箱子之间的碰撞、减少耗材成本,还节省了运输成本、运输空间,同时也更加绿色环保,减少过度包装,一举多得;不断推动物流数字化、智能化、绿色化。
Xgboost专题, 上海市, 2023
XGBoost是陈天奇等人开发的一个开源机器学习项目,高效地实现了GBDT算法并进行了算法和工程上的许多改进,被广泛应用在Kaggle竞赛及其他许多机器学习竞赛中并取得了不错的成绩。
Xgboost专题, 上海市, 2023
XGBoost 最初是由 Tianqi Chen 作为分布式(深度)机器学习社区(DMLC)组的一部分的一个研究项目开始的。XGBoost后来成为了Kaggle竞赛传奇——在2015年的時候29个Kaggle冠军队伍中有17队在他们的解决方案中使用了XGboost。
Xgboost专栏, 上海市, 2023
XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。 它在 Gradient Boosting 框架下实现机器学习算法。XGBoost提供并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop,SGE,MPI)上运行,并且可以解决数十亿个示例之外的问题。XGBoost [2]是对梯度提升算法的改进,求解损失函数极值时使用了牛顿法,将损失函数泰勒展开到二阶,另外损失函数中加入了正则化项。
时间序列预测, 上海市, 2022
销售预测作为供应链领域的核心算法,目前已经服务于国内数百家门店,日补货数百万SKU,为提升人力效率、减少缺货损耗发挥了重要作用。本文将揭示盒马销量预测的整体框架介绍和技术演进过程。
箱型推荐, 上海市, 2020
使用装箱算法进行包材推荐,通过运算为员工提供打包方案,指导员工挑选合适的包材为每个订单打包,大大降低了员工挑错包材或者挑选太大的包材的可能性,极大地降低了包材成本,快递成本,客诉成本,提升了打包作业的效率,减少包材使用也有利于环境保护。