首页 » 2016 » 十二月 » 03

手把手教你用.NET Core写爬虫

 

自从上一个项目 58HouseSearch 从.NET迁移到.NET core之后,磕磕碰碰磨蹭了一个月才正式上线到新版本。 然后最近又开了个新坑,搞了个 Dy2018Crawler 用来爬dy2018电影天堂上面的电影资源。这里也借机简单介绍一下如何基于.N … 阅读全文

JavaEE – JPA(4):EntityManager相关核心概念

 

前三篇文章花了一些笔墨介绍了事务的概念以及在EJB和spring Framework中分别是如何完成事务管理的。之所谓花了比较大的代价来介绍事务主要也是因为不管在什么类型的持久化应用中,都包含下面两个关键点: 事务管理 对象关系映射(ORM) 而JP … 阅读全文

BloomFilter原理,实现及优化

 

最近在做性能优化相关的事情,其中涉及到了BloomFilter,于是对BloomFilter总结了下,本文组织结构如下: BloomFilter的使用场景 BloomFilter的原理 BloomFilter的实现及优化 BloomFilter的使用场景 首先 … 阅读全文

OCR识别验证码

 

最近在爬某网站,老是蹦出来验证码,就想着找个OCR破了这个验证码,然后就开始了OCR探索之旅。 首先简单说一下什么是OCR OCR是(Optical Character Recognition, 光学字符识别 )的简称,主要用途: 办公用途,用来识别图片里面的 … 阅读全文

伪造掌阅ireader plus升级的服务器

 

1. Introduction 最近把原来的499 kindle卖掉了,换成了国内掌阅出的ireader plus(999),掌阅的性价比的确高一点,比(800)kwp3配置看起来高了一些。然而书城资源上,kindle的生态比掌阅好了很多。 我的主要阅读是非休 … 阅读全文