首页 » 2017 » 三月 » 09

一只优雅的小爬虫诞生记

 

爬虫,几家欢喜几人愁。爬者,拿到有利数据,分析行为,产生价值。被爬者,一是损失数据,二是遇到不怀好意的爬虫往往被全站复制或服务器受冲击而无法服务。今天说的是一只友好的爬虫是如何构建出来的,请勿用它伤害他人。 爬虫一生所遇 俗话说,如果我比别人看得远些,那是因为 … 阅读全文

从底层到应用,那些数据人的必备技能

 

本文由携程技术中心投递,ID:ctriptech。作者:潘鹏举,携程酒店研发部 BI 经理,负责酒店服务相关的业务建模工作,主要方向是用机器学习帮助业务创造价值。 前言:谨以此文献给对数据有热情,想长期从事此行业的年轻人,希望对你们有所启发,并快速调整思路和方 … 阅读全文

IBM WebSphere java反序列化漏洞分析

 

Nessus它是首选的漏洞扫描程序,它可以找到任何潜在的漏洞。在查看Nessus报告信息时我发现了一个IBM知名的WebSphere Application Server漏洞。 NESSUS报告 Nessus的报告上写着,IBM的WAS应用程序中存在以下关键漏 … 阅读全文

六款出色工具助您轻松实现JavaScript代码瘦身

 

【51CTO.com快译】总结来讲,所谓代码瘦身,即是从源代码当中删除不必要的字符的相关技术。业界亦将此称为代码压缩及代码最小化。很多生产型网站都在使用JavaScript瘦身举措,但JS本身亦提供相关技术以将脚本压缩为更小的单元。为了成功实现各类瘦身效果,W … 阅读全文

中小型团队的容器化之路

 

GrowingIO是基于用户行为的新一代数据分析产品,提供全球领先的数据采集和分析技术。作为一个创业公司我们时刻面临着业务的快速变化和规模的快速增长,为了获得良好的可扩展性,团队在系统设计之初就采用了微服务的架构。但是随着时间的推移,微服务的缺点也渐渐体现: … 阅读全文

利用深度学习进行时序数据的异常检测

 

本文要点 神经网络是一种模拟生物学神经的机器学习模型,数据来源于输入层并流经具有各种激活阈值的节点。 递归神经网络是一种在输入被理解之前保持其内部记忆的神经网络,所以它们可以进行数据流中时间依赖的结构的学习。 机器学习早已在许多产品中发挥过威力了,我们日常就与 … 阅读全文