×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
百分点认知智能实验室:智能校对的技术原理和实践
认知智能实验室 百分点科技稿 编者按: 大数据时代下各种文本信息爆炸,传统的文本分析处理工作逐渐被计算机取代。文本数据量越大,其中所包含的错误的总数也越多,通过校对工作来纠正文本中的错误显得尤其重要。传统的校对主要依赖人工,通过人来发现和纠正文本中的错误,人工校对效率低、强度大、周期长,显然已经不能 ....
star2017
博客
1年前
7545
0
字节技术 | 火山引擎 A/B 测试的思考与实践
康康 字节跳动技术团队 稿 本文整理自火山引擎开发者社区 Meetup 第四期同名演讲,主要为大家介绍了为什么要做 A/B 测试、火山引擎 A/B 测试系统架构及最佳实践。 为什么要做 A/B 测试 首先我们看一个案例。字节跳动有一款中视频产品叫西瓜视频,最早它叫做头条视频。为了提升产品的品牌辨识度 ....
star2017
博客
1年前
1143
0
百度技术 | 云原生架构下的持续交付实践
乌拉 百度技术 稿 [图片] 导读:随着虚拟化技术的成熟和分布式框架的普及,在容器技术、可持续交付、编排系统等开源社区的推动下,以及微服务等开发理念的带动下,应用上云已经是不可逆转的趋势。 云原生带来了标准化、松耦合、易观测、易扩展的特性,为交付基建与业务解耦、更灵活的环境管理和无损发布带来新机遇。 ....
star2017
博客
1年前
382
0
给个人博客添加图片查看器viewerjs
viewjs简介: Viewer.js 是一款强大的图片查看器,像门户网站一般都会有各自的图片查看器,如果您正需要一款强大的图片查看器,也许 Viewer.js 是一个很好的选择。Viewer.js 有以下特点: 支持移动设备触摸事件支持响应式支...
wylc123
博客
1年前
566
0
2021 年 7 月底,“陌陌”推荐算法 5 道面试题分享!
问题1:Graph SAGE的原理 [图片] GraphSAGE是Graph SAmple and aggreGatE的缩写,其运行流程如上图所示,可以分为三个步骤: 对图中每个顶点邻居顶点进行采样 根据聚合函数聚合邻居顶点蕴含的信息 得到图中各顶点的向量表示供下游任务使用 文末免费送电子书:七月在 ....
star2017
博客
1年前
11602
0
面试题精选 | 风控建模流程、分箱法的目的及第三方数据评估!
问题1:分箱后,各箱badrate单调递增从业务上怎么理解呀? 我们有个先验知识,多头越多badrate越大,历史逾期越多badrate越大...等等,如果变量分箱后不符合这个先验,可能就把他剃掉了。 Bad Rate: 坏样本率,指的是将特征进行分箱之后,每个bin下的样本所统计得到的坏样本率 b ....
star2017
博客
1年前
9254
0
金融风控大厂 10 道精选面试题分享!
问题1:深度学习的风控模型,从经验上看,样本量大概要多少条啊 解析:不同的模型不一样,而且也不光要注意样本量,比如RNN其实希望序列长度至少在12个月以上,粗略的说,样本量五十万以上效果比较好。 问题2:5万正样本,200负样本,B卡,不只是提高额度,会拒绝一部分客户,怎么建模? 5万负样本是没有做 ....
star2017
博客
1年前
10868
0
2021.09.05 AIQ-ChangeLogs
fix更新帖子403 forbidden问题 fix GIthub登陆超时异常登录失败问题 升级Markdown编辑器,更牛逼的MD编辑体验,支持导出PDF、HTML,支持导出文章到微信公众号、知乎 优化Mysql连接池,提升网站访问性能 优化注册、登陆引导模块体验 重新打开谷歌广告开关,辛苦各位老 ....
star2017
博客
1年前
479
0
腾讯基于预训练模型的文本内容理解实践
[图片] 分享嘉宾:赵哲博士 腾讯 高级研究员 编辑整理:张书源 爱丁堡大学 出品平台:DataFunTalk 导读: 预训练已经成为自然语言处理任务的重要组成部分,为大量自然语言处理任务带来了显著提升。本文将围绕预训练模型,介绍相关技术在文本内容理解方面的应用。更具体的,本文会首先对已有的经典预训 ....
star2017
博客
1年前
10289
0
2021 年七月中旬,百度算法面试 5 道题分享
文末免费送电子书:七月在线干货组最新 升级的《2021最新大厂AI面试题》免费送! 问题1:过拟合 怎么解决 过拟合:是指训练误差和测试误差之间的差距太大。换句换说,就是模型复杂度高于实际问题,模型在训练集上表现很好,但在测试集上却表现很差。 欠拟合:模型不能在训练集上获得足够低的误差。换句换说,就 ....
star2017
博客
1年前
10945
0
中国首个无人干预人工智能 RIDIC 系统垃圾发电现场视频
[链接] 中国首个无人干预人工智能垃圾发电现场视频
star2017
博客
1年前
8017
0
百度 | 一年数十万次 ABTest 实验背后的架构与数据科学
[图片] 作者:爱迪生 导读:人工智能时代,A/B Test实验是数据驱动型组织的核心依赖。一套好的实验系统能支撑产品快速迭代,用数据说话,辅助快速做出正确产品决策。那么如何保证几百上千人的团队在超复杂系统中保持高效迭代?如何在超大规模数据量下快速产出报表?如何降低抽样波动尽快产出置信的数据结论?本 ....
star2017
博客
1年前
1303
0
百度短视频推荐系统的目标设计
[图片] 作者:玉奇 导读:短视频产品最近两年蓬勃发展,百度旗下的短视频品牌-好看视频,人均使用时长70分钟,短视频播放量已超30亿,从推荐系统的角度考虑,如何设计一个推荐系统的目标,以及短视频迭代过程中沉淀的思考。 全文2433字,预计阅读时间 8分钟。 《2020年中国网络视听发展研究报告》显示 ....
star2017
博客
1年前
4565
0
融 360 金融风控系统开发实践
[图片] 分享嘉宾:贺鹏 融360 高级技术经理 编辑整理:安然 出品平台:DataFunTalk 导读: 在我们的风控工作中,风控系统解决的问题是什么?比如我们常见的监管要求、反欺诈、信用风险、黑产对抗、支付安全等。风控系统就是在大数据支撑下,根据风控专家经验制定规则策略、以及机器学习/深度学习/ ....
star2017
博客
1年前
6442
0
金融风控精选 5 道面试题分享 ! 文末彩蛋
文末免费送电子书:七月在线干货组最新 升级的《2021最新大厂AI面试题》免费送! 问题 1 :芝麻信用分的主要计算维度? 主要维度 个人属性:职业类型、学历学籍等; 稳定性:手机稳定性、地址稳定性、账户活跃时长等; 资产状况:账户资产、有无住房、有无车辆; 消费能力:消费金额、消费层次、消费场景丰 ....
star2017
博客
1年前
11024
0
颠覆性技术无需建模的人工智能,最快可 40 天上线,助力企业增效减排
RIDIC系统使用后,半年成本即可回收,企业技术岗位人员可申请省部级科技进步一二等奖,还可根据行业申请当地政府工信部门或者科技部门的政策性奖励。对于单位技术型领导和技术人员都有帮助,对评审职称等级帮助很大,同时对企业利润增加更是贡献巨大. 荣峰正见,经过8年的技术积累,在智能(智慧)工厂(企业集团) ....
star2017
博客
1年前
9413
0
由于幸存者偏差,导致强变量在后续迭代中逐渐削弱甚至相反怎么办 | 文末有福利
解析: 幸存者偏差(SurvivorshipBias)与样本不均衡(Imbalance Learning)问题都是由于风控模型的拒绝属性导致的。但表现形式略有不同。幸存者偏差是指,每次模型迭代时,使用的样本都是被前一个模型筛选过的,从而导致的样本空间不完备。 其实主要是添加负样本的问题。简单一些可以 ....
star2017
博客
1年前
8947
0
ES添加elasticsearch-sql插件,使用sql直接查询
1、查看sql插件github https://github.com/NLPchina/elasticsearch-sql 2、安装(7.1版本后已经内置可以直接使用) 也可以直接去github上下载放到 下载插件 https://githu...
wylc123
博客
1年前
3641
0
Elasticsearch、Logstash、Kibana添加密码步骤
1、ElasticSearch配置 版本: elasticsearch-7.1.1(6.2或更早版本需要安装X-PACK, 新版本已包含在发行版中) 配置:elastic...
wylc123
博客
1年前
2970
0
elasticsearch生成配置ca证书
背景 elasitcsearch 开启认证后,报DecoderException: javax.net.ssl.SSLHandshakeException: No available authentic异常 具体报错: [2020-09-05T0...
wylc123
博客
1年前
3192
0
1
...
338
339
340
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到