[
  {
    "path": ".gitignore",
    "content": "_site/*\n_theme_packages/*\n\nThumbs.db\n.DS_Store\n\n!.gitkeep\n\n.rbenv-version\n.rvmrc\n"
  },
  {
    "path": "License.md",
    "content": "## Qix\n\nCopyright (C) 2020 https://github.com/ty4z2008/Qix\n\nPermission is hereby granted, free of charge, to any person obtaining a copy of\nthis software and associated documentation files (the \"Software\"), to deal in\nthe Software without restriction, including without limitation the rights to\nuse, copy, modify, merge, publish, distribute, sublicense, and/or sell copies\nof the Software, and to permit persons to whom the Software is furnished to do\nso, subject to the following conditions:\n\nThe above copyright notice and this permission notice shall be included in all\ncopies or substantial portions of the Software.\n\nTHE SOFTWARE IS PROVIDED \"AS IS\", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR\nIMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,\nFITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE\nAUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER\nLIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,\nOUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE\nSOFTWARE.\n"
  },
  {
    "path": "Node style guide.md",
    "content": "# Node.js Style Guide\n\nThis is a guide for writing consistent and aesthetically pleasing node.js code.\nIt is inspired by what is popular within the community, and flavored with some\npersonal opinions.\n\nThis guide was created by [Felix Geisendörfer](http://felixge.de/) and is\nlicensed under the [CC BY-SA 3.0](http://creativecommons.org/licenses/by-sa/3.0/)\nlicense. You are encouraged to fork this repository and make adjustments\naccording to your preferences.\n\n![Creative Commons License](http://i.creativecommons.org/l/by-sa/3.0/88x31.png)\n\n## 2 Spaces for indention\n\nUse 2 spaces for indenting your code and swear an oath to never mix tabs and\nspaces - a special kind of hell is awaiting you otherwise.\n\n## Newlines\n\nUse UNIX-style newlines (`\\n`), and a newline character as the last character\nof a file. Windows-style newlines (`\\r\\n`) are forbidden inside any repository.\n\n## No trailing whitespace\n\nJust like you brush your teeth after every meal, you clean up any trailing\nwhitespace in your JS files before committing. Otherwise the rotten smell of\ncareless neglect will eventually drive away contributors and/or co-workers.\n\n## Use Semicolons\n\nAccording to [scientific research][hnsemicolons], the usage of semicolons is\na core value of our community. Consider the points of [the opposition][], but\nbe a traditionalist when it comes to abusing error correction mechanisms for\ncheap syntactic pleasures.\n\n[the opposition]: http://blog.izs.me/post/2353458699/an-open-letter-to-javascript-leaders-regarding\n[hnsemicolons]: http://news.ycombinator.com/item?id=1547647\n\n## 80 characters per line\n\nLimit your lines to 80 characters. Yes, screens have gotten much bigger over the\nlast few years, but your brain has not. Use the additional room for split screen,\nyour editor supports that, right?\n\n## Use single quotes\n\nUse single quotes, unless you are writing JSON.\n\n*Right:*\n\n```js\nvar foo = 'bar';\n```\n\n*Wrong:*\n\n```js\nvar foo = \"bar\";\n```\n\n## Opening braces go on the same line\n\nYour opening braces go on the same line as the statement.\n\n*Right:*\n\n```js\nif (true) {\n  console.log('winning');\n}\n```\n\n*Wrong:*\n\n```js\nif (true)\n{\n  console.log('losing');\n}\n```\n\nAlso, notice the use of whitespace before and after the condition statement.\n\n## Declare one variable per var statement\n\nDeclare one variable per var statement, it makes it easier to re-order the\nlines. However, ignore [Crockford][crockfordconvention] when it comes to\ndeclaring variables deeper inside a function, just the declarations wherever\nthey make sense.\n\n*Right:*\n\n```js\nvar keys   = ['foo', 'bar'];\nvar values = [23, 42];\n\nvar object = {};\nwhile (keys.length) {\n  var key = keys.pop();\n  object[key] = values.pop();\n}\n```\n\n*Wrong:*\n\n```js\nvar keys = ['foo', 'bar'],\n    values = [23, 42],\n    object = {},\n    key;\n\nwhile (keys.length) {\n  key = keys.pop();\n  object[key] = values.pop();\n}\n```\n\n[crockfordconvention]: http://javascript.crockford.com/code.html\n\n## Use lowerCamelCase for variables, properties and function names\n\nVariables, properties and function names should use `lowerCamelCase`.  They\nshould also be descriptive. Single character variables and uncommon\nabbreviations should generally be avoided.\n\n*Right:*\n\n```js\nvar adminUser = db.query('SELECT * FROM users ...');\n```\n\n*Wrong:*\n\n```js\nvar admin_user = db.query('SELECT * FROM users ...');\n```\n\n## Use UpperCamelCase for class names\n\nClass names should be capitalized using `UpperCamelCase`.\n\n*Right:*\n\n```js\nfunction BankAccount() {\n}\n```\n\n*Wrong:*\n\n```js\nfunction bank_Account() {\n}\n```\n\n## Use UPPERCASE for Constants\n\nConstants should be declared as regular variables or static class properties,\nusing all uppercase letters.\n\nNode.js / V8 actually supports mozilla's [const][const] extension, but\nunfortunately that cannot be applied to class members, nor is it part of any\nECMA standard.\n\n*Right:*\n\n```js\nvar SECOND = 1 * 1000;\n\nfunction File() {\n}\nFile.FULL_PERMISSIONS = 0777;\n```\n\n*Wrong:*\n\n```js\nconst SECOND = 1 * 1000;\n\nfunction File() {\n}\nFile.fullPermissions = 0777;\n```\n\n[const]: https://developer.mozilla.org/en/JavaScript/Reference/Statements/const\n\n## Object / Array creation\n\nUse trailing commas and put *short* declarations on a single line. Only quote\nkeys when your interpreter complains:\n\n*Right:*\n\n```js\nvar a = ['hello', 'world'];\nvar b = {\n  good: 'code',\n  'is generally': 'pretty',\n};\n```\n\n*Wrong:*\n\n```js\nvar a = [\n  'hello', 'world'\n];\nvar b = {\"good\": 'code'\n        , is generally: 'pretty'\n        };\n```\n\n## Use the === operator\n\nProgramming is not about remembering [stupid rules][comparisonoperators]. Use\nthe triple equality operator as it will work just as expected.\n\n*Right:*\n\n```js\nvar a = 0;\nif (a !== '') {\n  console.log('winning');\n}\n\n```\n\n*Wrong:*\n\n```js\nvar a = 0;\nif (a == '') {\n  console.log('losing');\n}\n```\n\n[comparisonoperators]: https://developer.mozilla.org/en/JavaScript/Reference/Operators/Comparison_Operators\n\n## Use multi-line ternary operator\n\nThe ternary operator should not be used on a single line. Split it up into multiple lines instead.\n\n*Right:*\n\n```js\nvar foo = (a === b)\n  ? 1\n  : 2;\n```\n\n*Wrong:*\n\n```js\nvar foo = (a === b) ? 1 : 2;\n```\n\n## Do not extend built-in prototypes\n\nDo not extend the prototype of native JavaScript objects. Your future self will\nbe forever grateful.\n\n*Right:*\n\n```js\nvar a = [];\nif (!a.length) {\n  console.log('winning');\n}\n```\n\n*Wrong:*\n\n```js\nArray.prototype.empty = function() {\n  return !this.length;\n}\n\nvar a = [];\nif (a.empty()) {\n  console.log('losing');\n}\n```\n\n## Use descriptive conditions\n\nAny non-trivial conditions should be assigned to a descriptively named variable or function:\n\n*Right:*\n\n```js\nvar isValidPassword = password.length >= 4 && /^(?=.*\\d).{4,}$/.test(password);\n\nif (isValidPassword) {\n  console.log('winning');\n}\n```\n\n*Wrong:*\n\n```js\nif (password.length >= 4 && /^(?=.*\\d).{4,}$/.test(password)) {\n  console.log('losing');\n}\n```\n\n## Write small functions\n\nKeep your functions short. A good function fits on a slide that the people in\nthe last row of a big room can comfortably read. So don't count on them having\nperfect vision and limit yourself to ~15 lines of code per function.\n\n## Return early from functions\n\nTo avoid deep nesting of if-statements, always return a function's value as early\nas possible.\n\n*Right:*\n\n```js\nfunction isPercentage(val) {\n  if (val < 0) {\n    return false;\n  }\n\n  if (val > 100) {\n    return false;\n  }\n\n  return true;\n}\n```\n\n*Wrong:*\n\n```js\nfunction isPercentage(val) {\n  if (val >= 0) {\n    if (val < 100) {\n      return true;\n    } else {\n      return false;\n    }\n  } else {\n    return false;\n  }\n}\n```\n\nOr for this particular example it may also be fine to shorten things even\nfurther:\n\n```js\nfunction isPercentage(val) {\n  var isInRange = (val >= 0 && val <= 100);\n  return isInRange;\n}\n```\n\n## Name your closures\n\nFeel free to give your closures a name. It shows that you care about them, and\nwill produce better stack traces, heap and cpu profiles.\n\n*Right:*\n\n```js\nreq.on('end', function onEnd() {\n  console.log('winning');\n});\n```\n\n*Wrong:*\n\n```js\nreq.on('end', function() {\n  console.log('losing');\n});\n```\n\n## No nested closures\n\nUse closures, but don't nest them. Otherwise your code will become a mess.\n\n*Right:*\n\n```js\nsetTimeout(function() {\n  client.connect(afterConnect);\n}, 1000);\n\nfunction afterConnect() {\n  console.log('winning');\n}\n```\n\n*Wrong:*\n\n```js\nsetTimeout(function() {\n  client.connect(function() {\n    console.log('losing');\n  });\n}, 1000);\n```\n\n## Use slashes for comments\n\nUse slashes for both single line and multi line comments. Try to write\ncomments that explain higher level mechanisms or clarify difficult\nsegments of your code. Don't use comments to restate trivial things.\n\n*Right:*\n\n```js\n// 'ID_SOMETHING=VALUE' -> ['ID_SOMETHING=VALUE'', 'SOMETHING', 'VALUE']\nvar matches = item.match(/ID_([^\\n]+)=([^\\n]+)/));\n\n// This function has a nasty side effect where a failure to increment a\n// redis counter used for statistics will cause an exception. This needs\n// to be fixed in a later iteration.\nfunction loadUser(id, cb) {\n  // ...\n}\n\nvar isSessionValid = (session.expires < Date.now());\nif (isSessionValid) {\n  // ...\n}\n```\n\n*Wrong:*\n\n```js\n// Execute a regex\nvar matches = item.match(/ID_([^\\n]+)=([^\\n]+)/));\n\n// Usage: loadUser(5, function() { ... })\nfunction loadUser(id, cb) {\n  // ...\n}\n\n// Check if the session is valid\nvar isSessionValid = (session.expires < Date.now());\n// If the session is valid\nif (isSessionValid) {\n  // ...\n}\n```\n\n## Object.freeze, Object.preventExtensions, Object.seal, with, eval\n\nCrazy shit that you will probably never need. Stay away from it.\n\n## Getters and setters\n\nDo not use setters, they cause more problems for people who try to use your\nsoftware than they can solve.\n\nFeel free to use getters that are free from [side effects][sideeffect], like\nproviding a length property for a collection class.\n\n[sideeffect]: http://en.wikipedia.org/wiki/Side_effect_(computer_science)\n"
  },
  {
    "path": "README.md",
    "content": "\n[![PRs Welcome](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com) ![GitHub stars](https://img.shields.io/github/stars/ty4z2008/qix.svg?style=plastic) ![GitHub forks](https://img.shields.io/github/forks/ty4z2008/qix.svg?color=blue&style=plastic) \n\n## About Me\n\nWeiBo: [@廖君_Jun](http://weibo.com/ty4z2008)\n\nTwitter: [@廖君](https://twitter.com/ty4z2008)\n\nE-Mail: ty4z2008@gmail.com\n\nScale System Channel: [https://t.me/scalesystem](https://t.me/scalesystem)\n\n**NOTE** \n\nThere may be some incorrect information in the article. I hope i can correct error with you.  you can contact me with Email or PR\n\n## Pull Request welcome:blush:\n\n## My translation\n\n### node-mysql document translate\n\n- [node-mysql offcial document](https://github.com/felixge/node-mysql/blob/master/Readme.md)\n\n- [node-mysql Chinese document](https://github.com/ty4z2008/Qix/blob/master/node.md)\n\n## Machine Learning And deep learning Resources\n\n- [Chapter 1](https://github.com/ty4z2008/Qix/blob/master/dl.md)\n\n- [Chapter 2](https://github.com/ty4z2008/Qix/blob/master/dl2.md)\n\n## Golang learning resources\n\n- [Chapter 1](https://github.com/ty4z2008/Qix/blob/master/golang.md)\n\n\n## PostgreSQL database resources\n\n- [Chapter 1](https://github.com/ty4z2008/Qix/blob/master/pg.md)\n\n\n## Distributed system resources\n\n- [Chapter 1](https://github.com/ty4z2008/Qix/blob/master/ds.md)\n\n## Database system resources\n\n- [Chapter 1](https://github.com/ty4z2008/Qix/blob/master/db.md)\n\n\n\n## Additional notes\n\nDear friends. In order to respect to  the efforts   of authorship. In the reading process, when you find that resource the authorship is incorrect I also want you to[Submit feedback](https://github.com/ty4z2008/Qix/issues)。Thanks buddy！\n\n## License\n\n[MIT License](https://github.com/ty4z2008/Qix/blob/master/License.md)\n"
  },
  {
    "path": "algorithm.md",
    "content": "## 算法与数据结构\n\n* [《Data structures》](https://courses.csail.mit.edu/6.851/spring12/scribe/2012scribes.pdf)\n\n介绍：高级数据结构大全,[基本算法：二叉树等](http://algorithms.openmymind.net/)\n\n* [《基于用户投票的排名算法（一）：Delicious和Hacker News》](http://www.ruanyifeng.com/blog/2012/02/ranking_algorithm_hacker_news.html)\n\n介绍：此外还有[《基于用户投票的排名算法（二）：Reddit》](http://www.ruanyifeng.com/blog/2012/03/ranking_algorithm_reddit.html)、[《基于用户投票的排名算法（三）：Stack Overflow》](http://www.ruanyifeng.com/blog/2012/03/ranking_algorithm_stack_overflow.html)、[《基于用户投票的排名算法（四）：牛顿冷却定律》](http://www.ruanyifeng.com/blog/2012/03/ranking_algorithm_newton_s_law_of_cooling.html)、[《基于用户投票的排名算法（五）：威尔逊区间》](http://www.ruanyifeng.com/blog/2012/03/ranking_algorithm_wilson_score_interval.html)\n\n* [《Paxos算法》](http://zh.wikipedia.org/wiki/Paxos%E7%AE%97%E6%B3%95)\n\n介绍：这是目前的一种基于消息传递且具有高度容错特性的一致性算法，google在分布式文件系统中与分布式锁中就应用到了这个算法，MapReduce，bigTable等等，中国的[alibaba集团的中间件](http://jm-blog.aliapp.com/?tag=paxos)也使用此算法．他们把这个算法的[英文版](http://research.microsoft.com/en-us/um/people/lamport/pubs/lamport-paxos.pdf)翻译成了[中文版](http://wenku.baidu.com/view/87276e1dfad6195f312ba6d7.html)．有关它的更多描叙可以参考耶鲁大学的[专题页面](http://www.cs.yale.edu/homes/aspnes/pinewiki/Paxos.html)\n\n* [《How to: What are the lesser known but useful data structures?》](http://sevennet.org/2014/11/21/how-to-what-are-the-lesser-known-but-useful-data-structures/)\n\n介绍：很少人知道但很有用的数据结构\n\n* [《Open Data Structures》](http://opendatastructures.org/)\n\n介绍：《开放数据结构》，里面有C++.java相关实现的书籍\n\n* [《Data Structure and Algorithms for Information Processing》](http://www.andrew.cmu.edu/user/mm6/95-771/schedule.html)\n\n介绍：卡内基梅隆大学的信息处理的数据结构与算法课程课件\n\n* [《CVonline: Applications》](http://homepages.inf.ed.ac.uk/rbf/CVonline/applic.htm)\n\n介绍：图像和视觉算法的应用领域概括，共包含了29个大类，从中可以看到图像视觉算法应用之广泛。例如人就分生物认证、身体、头、脸、脚、手等不同的领域。\n\n* [《Sampling, or a faster LZ4》](http://fastcompression.blogspot.fr/2015/04/sampling-or-faster-lz4.html)\n\n介绍：高速数据压缩算法[LZ4](https://github.com/Cyan4973/lz4).\n\n* [《Fundraising Roadmap Algorithm》](http://codingvc.com/fundraising-roadmap-algorithm/)\n\n介绍：融资路线图算法.\n\n* [《Weak Learning, Boosting, and the AdaBoost algorithm》](http://jeremykun.com/2015/05/18/boosting-census/)\n\n介绍：弱学习/Boosting/AdaBoost算法.\n\n* [《The easy way to implement a Red-Black tree》](http://www.garrisonjensen.com/programming/2015/05/15/easy-red-black-tree.html)\n\n介绍：红黑树最容易的实现方式.\n\n* [《Algorithmic Game Theory》](http://www.cambridge.org/journals/nisan/downloads/Nisan_Non-printable.pdf)\n\n介绍:这是一本关于博弈论算法的电子书,[博弈论介绍](https://www.wikiwand.com/zh/%E5%8D%9A%E5%BC%88%E8%AE%BA)\n\n* [《Algorithms for Hyper-Parameter Optimization》](http://papers.nips.cc/paper/4443-algorithms-for-hyper-parameter-optimization.pdf)\n\n介绍：参数优化算法.\n\n* [《A guide to Algorithmic Complexity》](http://algosaur.us/)\n\n介绍:Introduce Algorithmic Complexity with images.\n\n* [《The real 10 algorithms that dominate our world》](https://medium.com/@_marcos_otero/the-real-10-algorithms-that-dominate-our-world-e95fa9f16c04)\n\n介绍:真正统治世界的十大算法,[译版](http://blog.jobbole.com/70639/).\n\n* [《What is the importance of this algorithm?》](http://www.quora.com/What-is-the-importance-of-this-algorithm)\n\n介绍:Quora上的一篇关于有哪些重要的算法提问.\n\n* [《Clever Algorithms: Nature-Inspired Programming Recipes》](http://www.cleveralgorithms.com/nature-inspired/index.html)\n\n介绍:智能算法手册(7类/45个之智能相关算法及示例).\n\n* [《Data Structure Visualizations》](http://www.cs.usfca.edu/~galles/visualization/Algorithms.html)\n\n介绍:数据结构可视化图形.\n\n* [《Paxos algorithm》](https://www.quora.com/Distributed-Systems/What-is-a-simple-explanation-of-the-Paxos-algorithm)\n\n介绍:如果简单的解释Paxos算法,此外推荐论文[Paxos Made Simple](https://pdos.csail.mit.edu/6.824/papers/paxos-simple.pdf),[Consensus Protocols: Paxos](http://the-paper-trail.org/blog/consensus-protocols-paxos/),[Consensus Protocols: Two-Phase Commit](http://the-paper-trail.org/blog/consensus-protocols-two-phase-commit/),[Consensus Protocols: Three-phase Commit](http://the-paper-trail.org/blog/consensus-protocols-three-phase-commit/)\n\n* [《Introduction to Algorithms》](http://courses.csail.mit.edu/6.006/fall11/staff.shtml)\n\n介绍:Introduction to Algorithms.\n\n* [《An Open Source Reference Architecture For Real-Time Stock Prediction》](https://blog.pivotal.io/big-data-pivotal/case-studies/an-open-source-reference-architecture-for-real-time-stock-prediction)\n\n介绍:实时股票分析系统的架构与算法[译文](http://www.infoq.com/cn/news/2015/12/open-source-reference-architectu).\n\n* [《Overview of Recommender Algorithms part1》](https://buildingrecommenders.wordpress.com/2015/11/16/overview-of-recommender-algorithms-part-1/)\n\n介绍：推荐算法概览[part2](https://buildingrecommenders.wordpress.com/2015/11/18/overview-of-recommender-algorithms-part-2/),[part3](https://buildingrecommenders.wordpress.com/2015/11/19/overview-of-recommender-algorithms-part-3/),[part4](https://buildingrecommenders.wordpress.com/2015/11/20/overview-of-recommender-algorithms-part-4/),[part5](https://buildingrecommenders.wordpress.com/2015/11/23/overview-of-recommender-algorithms-part-5/),部分译文[part1](http://www.infoq.com/cn/articles/recommendation-algorithm-overview-part01),[part2](http://www.infoq.com/cn/articles/recommendation-algorithm-overview-part02),同时推荐[Recommender Systems in Netflix](https://buildingrecommenders.wordpress.com/2015/11/18/recommender-systems-in-netflix/)\n\n* [《The Use of Machine Learning Algorithms in Recommender Systems: A Systematic Review》](http://arxiv.org/abs/1511.05263)\n\n介绍:推荐系统机器学习算法系统综述.\n\n* [《Top 10 data mining algorithms in plain English》](http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-english/)\n\n介绍:白话数据挖掘十大算法\n\n* [《Designing and Implementing a Ranking Algorithm》](https://jkchu.com/2016/02/17/designing-and-implementing-a-ranking-algorithm/)\n\n介绍:排名算法的设计与实现\n\n* [《Quantum algorithms: an overview》](http://www.nature.com/articles/npjqi201523?WT.mc_id=FBK_NPG_1602_npjQI)\n\n介绍:量子算法概述\n\n* [《Robert Sedgewick HomePage》](https://www.cs.princeton.edu/~rs/)\n\n介绍:罗伯特·塞奇威克的主页，是算法一书的作者，目前这本书已经到了第四版[ Algorithms, 4th Edition](http://algs4.cs.princeton.edu/home/),电子版是免费的，而且还有相对于的源码和课程资料,他的[Analytic Combinatorics](http://ac.cs.princeton.edu/home/)解析组合数学也很有名\n\n* [《Communicating sequential processes》](http://spinroot.com/courses/summer/Papers/hoare_1978.pdf)\n\n介绍:通信顺序进程是并发编程的经典论文,Go的模型（还有Erlang等）都是基于CPS.此外推荐[Communicating Parallel Processes](http://www.cs.cmu.edu/~brookes/papers/hoare.pdf)\n\n* [《Niklaus Wirth Homepage》](https://www.inf.ethz.ch/personal/wirth/)\n\n介绍:尼克劳斯·维尔特主页，图灵奖获得者。Algol W， Modula， Pascal ，Modula-2， Oberon之父。他的论文[Programming in Oberon: Steps beyond Pascal and Modula.](https://www.inf.ethz.ch/personal/wirth/ProgInOberon.pdf)被视为软件工程的经典之作\n\n* [《Donald E. Knuth HomePage》](http://www-cs-faculty.stanford.edu/~uno/)\n\n介绍:唐纳德·尔文·克努斯是图灵奖获得者.其经典著作《计算机程序设计艺术》更是被誉为算法中“真正”的圣经，像KMP和LR(K)这样令人不可思议的算法，在此书比比皆是。难怪连Bill Gates都说：“如果能做对书里所有的习题，就直接来微软上班吧！”\n\n* [《Jon Bentley HomePage》](http://c2.com/cgi/wiki?JonBentley)\n\n介绍:著有编程珠玑[Programming Pearls, Second Edition](https://tfetimes.com/wp-content/uploads/2015/04/ProgrammingPearls2nd.pdf)\n\n* [《Edsger Wybe Dijkstra HomePage》](http://www.cs.utexas.edu/~EWD/)\n\n介绍:艾兹赫尔·韦伯·戴克斯特拉是荷兰第一位以程式为专业的科学家,以发现了图论中的最短路径算法（[Dijkstra算法](https://www.ssucet.org/old/pluginfile.php/2121/mod_resource/content/1/21-dijkstra.pdf)）而闻名于世，1972年因为ALGOL第二代编程语言而获得图灵奖。GOTO有害论“[Go To StatementConsidered Harmful](http://homepages.cwi.nl/~storm/teaching/reader/Dijkstra68.pdf)”(EWD215)也是被广为传颂的经典之作.推荐[Using Dijkstra's algorithm to draw maps](https://github.com/ibaaj/dijkstra-cartography). 如果是学习，可能论文会比较难。推荐阅读[理解Dijkstra算法](https://aos.github.io/2018/02/24/understanding-dijkstras-algorithm/)\n\n* [《John Backus HomePage》](http://www.columbia.edu/cu/computinghistory/backus.html)\n\n介绍:FORTRAN之父,提出了规范描述编程语言语法的BNF。这位当年的“差生”终于被整个计算机世界肯定——美国计算机协会于1977年授予John Backus图灵奖\n\n* [《James Cooley HomePage》](http://ethw.org/James_W._Cooley)\n\n介绍:美国数学家，哥伦比亚大学的数学博士，以他所创造的快速傅立叶变换(FFT)而著名\n\n* [《6.851: Advanced Data Structures》](https://courses.csail.mit.edu/6.851/)\n\n介绍：麻省理工数据结构课程\n\n* [《CS106B: Programming Abstractions in C++》](http://web.stanford.edu/class/archive/cs/cs106b/cs106b.1126/)\n\n介绍：斯坦福大学C++课程,推荐 ppt[Advanced Data Structures](http://web.stanford.edu/class/archive/cs/cs106b/cs106b.1126/lectures/21/Slides21.pdf)\n\n* [《A Visual Introduction to Algorithms》](https://www.educative.io/collection/10370001/760001)\n\n介绍：算法的可视化入门教程。通过组合的文章，可视化，测验，和编码的挑战来学习介绍计算机科学的算法，包括搜索，分类，递归，和图形理论。并用Python，C++或JavaScript来挑战实现\n\n* [《Algorithm Visualizer》](https://github.com/parkjs814/AlgorithmVisualizer)\n\n介绍：算法可视化工具\n\n* [《How to Write Your Own Recommendation System》](http://elliot.land/how-to-write-your-own-recommendation-system-part-1)\n\n介绍：自己动手如何写一个推荐系统\n\n* [《All algorithms implemented in Python (for education)》](https://github.com/TheAlgorithms/Python)\n\n介绍：常用算法实现python版\n\n* [《A collection of links for streaming algorithms and data structures》](https://gist.github.com/debasishg/8172796)\n\n介绍：流算法&数据结构资源列表\n\n* [《Algorithms introduce》](https://www.khanacademy.org/computing/computer-science/algorithms)\n\n介绍：由算法导论作者Thomas Cormen的专栏\n\n* [《Datastructures for external memory》](http://blog.omega-prime.co.uk/?p=197)\n\n介绍：高级数据结构：外存储算法。很详细\n\n* [《An overview of gradient descent optimization algorithms》](http://sebastianruder.com/optimizing-gradient-descent/)\n\n介绍：梯度下降优化算法的好材料，不仅讲解了Adagrad、Adadelta、RMSprop、Adam等基本算法，还有并行和分布式SGD，Shuffling and Curriculum Learning、Batch normalization、Early Stopping、Gradient noise等。\n\n* [《[ebook]Foundations of Data Science》](https://www.cs.cornell.edu/jeh/book2016June9.pdf)\n\n介绍：《数据科学基础》作者：ACM Fellow Avrim Blum, 图灵奖得主John Hopcroft，以及微软首席科学家Ravindran Kannan\n\n* [《MIT:6.851: Advanced Data Structures》](http://courses.csail.mit.edu/6.851/)\n\n介绍：麻省理工学院研究生课程 6.851《高级数据结构》。Erik Demaine教授主讲。\n\n* [《Jeff Erickson's Algorithms, Etc. Web + 1,250 pages in one PDF file》](http://jeffe.cs.illinois.edu/teaching/algorithms/)\n\n介绍：伊利诺伊大学厄巴纳-香槟分校计算机科学系的教授及前副主任Jeff Erickson 有关算法的资料\n\n* [《350+ Data structures programming interview questions》](https://techiedelight.quora.com/350%2B-Data-structures-programming-interview-questions)\n\n介绍： 350+ 数据结构编程面试问题。\n\n* [《Illustrated Algorithms》](https://github.com/skidding/illustrated-algorithms)\n\n介绍：算法的可视化，把一个个的算法变成动画\n\n* [《Mathematics for Computer Science》](https://courses.csail.mit.edu/6.042/spring17/mcs.pdf)\n\n介绍：由Google和麻省理工大学合著的《计算机科学的数学》。1000多页PDF\n\n* [《algorithms-primer 》](https://github.com/stacygohyunsi/algorithms-primer)\n\n介绍：算法与数据结构学习资源合集,能帮助你更简单的理解一些重要的数据结构和算法\n\n* [《常见算法实现》](https://github.com/qiwsir/algorithm)\n\n介绍：常见算法实现\n\n* [《International Conference on Algorithmic Learning Theory》](http://proceedings.mlr.press/v76/)\n\n介绍：算法学习理论国际会议\n\n* [《Deep learning Algorithms tutorial》](https://github.com/KeKe-Li/tutorialm)\n\n介绍：常见的机器学习算法\n\n* [《Matters Computational Ideas, Algorithms, Source Code》](https://jjj.de/fxt/fxtbook.pdf)\n\n介绍：计算思想和算法的教科书.\n\n* [《Computational Linear Algebra for Coders》](https://github.com/fastai/numerical-linear-algebra)\n\n介绍：写给程序员的线性代数课程.\n\n* [《100 Suggested Final Project Topics》](http://web.stanford.edu/class/cs166/handouts/100%20Suggested%20Final%20Project%20Topics.pdf)\n\n介绍：斯坦福[CS160:数据结构](http://web.stanford.edu/class/cs166/)结课关于数据结构话题分类。字符串相关、最优MST算法、范围查找、LCA算法、二叉树等。包括简单介绍和为什么需要学习他们\n\n* [《15-853: Algorithms in the \"Real World\"》](http://www.cs.cmu.edu/afs/cs/project/pscico-guyb/realworld/www/indexS18.html)\n\n介绍：CMU的算法在工业界的应用课程\n\n* [《15-859: Algorithms for Big Data, Fall 2017》](http://www.cs.cmu.edu/~dwoodruf/teaching/15859-fall17/index.html)\n\n介绍：CMU的算法在大数据的应用课程"
  },
  {
    "path": "awesome.md",
    "content": "## 一些非常棒的资源\n\n#### 这是一个自己的资料集,主要是做一个资料整理.方便自己查阅\n\n* [《Hands-on Labs for Security Education》](http://www.cis.syr.edu/~wedu/seed/ )\n\n介绍:SEEDLabs是雪城大学杜文亮教授创立的信息安全实验室，十几年来得到了全球上百所大学的认可。里面包含了web,software,network,operation system等等相关的信息安全资料.\n\n* [《Over API》](http://overapi.com/ )\n\n介绍:OverAPI：网罗所有编程语言和框架的速查表干货大全.基本上把所能见到的编程语言、框架、数据库、操作系统、设计模式等等东西都包含了，覆盖范围相当广泛.\n\n* [《FreeBSD Documentation and Resources》](http://freebsd.active-venture.com/)\n\n介绍:FreeBSD文档和资源：安装，配置，源码分析\n\n* [《Linux Documentation and Resources》](http://linux.die.net/)\n\n介绍:Linux：安装，配置，源码分析,还有在线电子书[Bash Guide for Beginners](http://linux.die.net/Bash-Beginners-Guide/)等等\n\n* [《Linux Documentation and Resources》](http://linux.die.net/)\n\n介绍:Linux：安装，配置，源码分析,还有在线电子书[Bash Guide for Beginners](http://linux.die.net/Bash-Beginners-Guide/)等等\n* [《Learn X in Y minutes》](http://learnxinyminutes.com/)\n\n介绍:编程语言快速学习指南,主要是对编程语言代码的分析\n\n* [《Java Tutorial》](http://www.javatpoint.com/java-tutorial)\n\n介绍:在线Java教程,适合入门学习\n\n* [《Search Code》](https://searchcode.com/)\n\n介绍:Search Code是一个在线代码检索引擎,正所谓:源码之下了无痕！是一个进行源码分析与学习的好工具,此外还有一个代码搜索引擎,比search code稳定,是[openhub](https://code.openhub.net/)\n\n* [《Software Engineering Blogs》](https://github.com/kilimchoi/engineering-blogs)\n\n介绍:国外很多有名的软件工程师博客地址.\n\n* [《Git resource》](https://github.com/xirong/my-git)\n\n介绍:个人学习git的资料整理\n\n* [《awsome-speaking》](https://github.com/matteofigus/awesome-speaking)\n\n介绍:一些关于公众演讲的资源整理\n\n* [《waifu2x》](https://github.com/nagadomi/waifu2x)\n\n介绍:一个图片放大项目\n\n* [《The Official raywenderlich.com Swift Style Guide.》](https://github.com/raywenderlich/swift-style-guide)\n\n介绍:Swift编码指南\n\n* [《Python spider》](https://github.com/binux/pyspider)\n\n介绍:一个强大的爬虫系统,[相关介绍](http://blog.binux.me/2014/11/introduction-to-pyspider/)\n\n* [《The Art of Command Line》](https://github.com/jlevy/the-art-of-command-line)\n\n介绍:命令行的艺术,学习Linux命令的好资源,此外文中提到的[explain shell](http://explainshell.com/)很赞\n\n* [《C++ 资源》](https://github.com/jobbole/awesome-cpp-cn)\n\n介绍:涉及到了标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等，C++程序员学习必备！\n\n* [《A First Course in Database Systems》](http://infolab.stanford.edu/~ullman/fcdb.html)\n\n介绍:斯坦福数据库系统基础教程课程主页,干货丰富\n\n* [《架构学习资料整理（2013)》](http://www.diguage.com/archives/41.html)\n\n介绍:资料虽然是2013年的,但'味道'并没有变\n\n* [《The Benchmark Handbook》](http://research.microsoft.com/en-us/um/people/gray/benchmarkhandbook/toc.htm)\n\n介绍:图灵奖获得者,数据库专家Jim Gray (Ed.)的电子书《The Benchmark Handbook for Database and Transaction Systems (2nd Edition)》\n\n* [《Online course that covers Unix/Linux Systems programming》](http://unix.stackexchange.com/questions/75686/online-course-that-covers-unix-linux-systems-programming)\n\n介绍:计算机科学在线课堂\n\n* [《编程语言入门视频教程》](https://github.com/buckyroberts/Source-Code-from-Tutorials)\n\n介绍:编程语言入门视频,比较基础\n\n* [《CS for All》](http://www.cs.hmc.edu/csforall/)\n\n介绍:国外的计算机科学入门课程配套书籍\n\n* [《Diagrams for InnoDB data structures and behaviors》](https://github.com/jeremycole/innodb_diagrams)\n\n介绍:MySQL数据库的数据库引擎InnoDB内部结构分析\n\n* [《Architectural Styles and the Design of Network-based Software Architectures》](https://www.ics.uci.edu/~fielding/pubs/dissertation/top.htm)\n\n介绍:架构风格与基于网络的软件架构设计.[中文版](https://mysql-udf-http.googlecode.com/files/REST_cn.pdf)\n\n* [《\tWhat does it take to make Google work at scale?》](https://docs.google.com/presentation/d/1OvJStE8aohGeI3y5BcYX8bBHwoHYCPu99A3KTTZElr0/preview?sle=true&slide=id.p)\n\n介绍:Google究竟是如何运作的.幻灯片中提到的[google stack](http://malteschwarzkopf.de/research/assets/google-stack.pdf).还推荐[Cambridge Systems at Scale (CamSaS)](http://www.cl.cam.ac.uk/research/srg/netos/camsas/)\n\n* [《Linux inside》](https://github.com/0xAX/linux-insides)\n\n介绍:深入Linux系统内部\n\n* [《Database System Implementation》](https://web.stanford.edu/class/cs346/2015/)\n\n介绍:斯坦福大学的数据库系统实现课程\n\n* [《Percona eBooks》](https://www.percona.com/resources/ebooks)\n\n介绍:Percona出品的MySQL电子书籍\n\n* [《Linux Performance and Tuning Guidelines》](http://www.brendangregg.com/linuxperf.html)\n\n介绍:Linux性能与调优指南\n\n* [《Steve's Bourne-- Bash shell scripting tutorial》](http://steve-parker.org/sh/sh.shtml)\n\n介绍:Linux bash脚本编程教程\n\n* [《ProgrammableWeb - APIs, Mashups and the Web as Platform》](http://www.programmableweb.com/)\n\n介绍:这是一个API资源站,专业的事情交给专业人做.让工程师更加的注重业务逻辑\n\n* [《Docker Resources All In One》](https://github.com/hangyan/docker-resources)\n\n介绍:大量 Docker 学习资源\n\n* [《Awesome Images》](https://github.com/heyalexej/awesome-images)\n\n介绍:常用图片库\n\n* [《Mathematical and scientific symbols》](http://www.uefap.com/speaking/symbols/symbols.htm)\n\n介绍:数学符号英文发音，此外推荐一个更全的[Handbook for Spoken Mathematics](http://web.efzg.hr/dok/MAT/vkojic/Larrys_speakeasy.pdf)\n\n* [《Open Source Society University:Path to a free self-taught education in Computer Science!》](https://github.com/open-source-society/computer-science)\n\n介绍:一个人自学计算机科学之路\n\n* [《Software architecture for developers》](http://www.codingthearchitecture.com/)\n\n介绍:软件架构之路\n\n* [《Learn how to beat the coding interview》](https://www.interviewcake.com/)\n\n介绍:interviewcake是国外的面试题挑战站点,不仅仅提供了国外有名公司的面试试题.还提供了面试题解析\n\n* [《Five Open-Source Slack Alternatives》](https://blog.okturtles.com/2015/11/five-open-source-slack-alternatives/)\n\n介绍:Slack 是企业级聊天工具，把可以把各种碎片化的企业沟通和协作集中到一起。目前有5个可替代Slack的开源产品：Friends，Let’s Chat，Mattermost，Rocket.Chat，Zulip。可作为企业选项时参考\n\n* [《The Architecture of Open Source Applications》](http://aosabook.org/en/index.html)\n\n介绍:开源软件架构分析\n\n* [《How to Have a Bad Career in Research/Academia》](http://pages.cs.wisc.edu/~markhill/patterson_bad_career_98.pdf)\n\n介绍:强烈推荐美国三院院士、ACM及IEEE Fellow、伯克利计算机系教授[David Patterson](http://www.eecs.berkeley.edu/Faculty/Homepages/patterson.html)昨天关于做学术研究的经典演讲《如何在学术界获得一个不好的职业生涯》 作者讲述了其从摔跤手开始，读研经费被砍，意外当上伯克利教授，成为RISC大神领悟到的各种体会。推荐本科和研究生学习。[地址](https://www.youtube.com/watch?v=Pbdo-ozuOug)\n\n* [《Awesome Stock Resources》](https://github.com/neutraltone/awesome-stock-resources)\n\n介绍:设计师awesome系列\n\n* [《How to Make a Computer Operating System》](https://github.com/SamyPesse/How-to-Make-a-Computer-Operating-System)\n\n介绍:使用 C/C++写一个操作系统.\n\n* [《Freely available programming books》](https://github.com/vhf/free-programming-books)\n\n介绍:免费编程电子书\n\n* [《Awesome Interviews》](https://github.com/MaximAbramchuck/awesome-interviews)\n\n介绍:面试Awesome系列\n\n* [《You Don't Need jQuery》](https://github.com/oneuijs/You-Dont-Need-jQuery)\n\n介绍:jQuery替代方案\n\n* [《What source code is worth studying?》](https://news.ycombinator.com/item?id=879101)\n\n介绍:如何选择一些好的源码学习,[What source code is worth studying?02](https://news.ycombinator.com/item?id=879101),[What source code is worth studying?02](https://news.ycombinator.com/item?id=7602237)\n\n* [《How to write a great research paper》](http://research.microsoft.com/en-us/um/people/simonpj/papers/giving-a-talk/writing-a-paper-slides.pdf)\n\n介绍:如何写出高质的论文？7个基础建议：1.及时动笔，论文能帮你明确研究；2.理清你的核心想法；3.讲好一个故事，包括描述问题到解决问题；4.详述贡献；5.提供相关文献；6.铭记“读者至上”；7.倾听读者的看法[youtube](https://www.youtube.com/watch?v=g3dkRsTqdDA),[youku](http://v.youku.com/v_show/id_XMTQ0MzcwODM3Mg==.html)\n\n* [《Ph.D Useful Thoughts about Research》](http://www.eecs.harvard.edu/htk/phdadvice/)\n\n介绍:博士生如何在研究领域得心应手\n\n* [《资料汇集》](http://dirlt.com/)\n\n介绍:内容分涵盖面之广：APUE(Unix环境高级编程),UNP(Unix网络编程),tcmalloc,gperftools,tcmalloc,ubuntu,之前有过痛苦的经历,macosx,docker,libev,muduo,kylin,linsd(百度首席架构师林仕鼎),zeromq,netty,finagle,gunicorn,leveldb,mongodb,redis,mysql,rcfile,orcfile,parquet,Cracking The Coding Interview,Bitcoin: A Peer-to-Peer Electronic Cash System,snappy,lzf,redis,sklearn,caffe,机器学习基石 on Coursera,机器学习技法 on Coursera,The Django Book\n\n* [《斯坦福：数学思维导论》](https://www.coursera.org/course/maththink)\n\n介绍:老师是<数学思维导论:学会像数学家一样思考>作者\n\n* [《Front-end Developer Handbook》](http://www.frontendhandbook.com/)\n\n介绍:前端工程师手册\n\n* [《前端工程师手册》](https://leohxj.gitbooks.io/front-end-database/content/)\n\n介绍:这本书与 [《Front-end Developer Handbook》](http://www.frontendhandbook.com/)不同，前者是技术，后者是整个前端工程师之路\n\n* [《Node wiki book》](https://y2468101216.gitbooks.io/node-wiki-book/content/)\n\n介绍:這是一本关于Node.js 技术的开放源码电子书\n\n* [《Shell 编程范例》](https://tinylab.gitbooks.io/shellbook/content/)\n\n介绍:不同于传统 Shell 书籍，本书并未花大篇幅去介绍 Shell 语法，而是以面向“对象” 的方式引入大量的实例介绍 Shell 日常操作，“对象” 涵盖数值、逻辑值、字符串、文件、进程、文件系统等。这样有助于学以致用，并在用的过程中提高兴趣。也可以作为 Shell 编程索引，在需要的时候随时检索。推荐[bash handbook](https://github.com/denysdovhan/bash-handbook)\n\n* [《Linux socket 网络程序设计》](http://beej-zhcn.netdpi.net/)\n\n介绍:本書是 Linux socket 网络程序设计的敲门砖，对初学者而言是一份好的开始,尤其是第七章介绍了重要的Linux scoket网络编程的技巧与理念\n\n* [《Linux kernel coding style》](https://tinylab.gitbooks.io/linux-doc/content/en/CodingStyle.html)\n\n介绍:Linux内核编码规范,大家都知道Linus Torvalds对于编码格式要求非常严格.因为好的代码就像一件工艺品.既有美又有价值\n\n* [《C 语言编程透视》](https://tinylab.gitbooks.io/cbook/content/)\n\n介绍:本书与[《深入淺出 Hello World》](http://blog.linux.org.tw/~jserv/archives/001844.html)有着类似的心路历程，旨在以实验的方式去探究类似 Hello World 这样的小程序在开发与执行过程中的微妙变化，一层层揭开 C 语言程序开发过程的神秘面纱，透视背后的秘密，不断享受醍醐灌顶的美妙。\n\n* [《Marvin Minsky：A Framework for Representing Knowledge》](http://web.media.mit.edu/~minsky/papers/Frames/frames.html)\n\n介绍:人工智能研究巨擘，1969年图灵奖得主，1991年IJCAI终身成就奖得主，MIT计算机学科奠基人马文.闵斯基之作,他诸多成就中最广为人知的是作为神经网络研究先驱，他构建了世界上第一个神经网络仿真工具，而他在1969年的著作又直接导致了此后15年的神经网络“冰河期”.[Steps Toward Artificial Intelligence](http://web.media.mit.edu/~minsky/papers/steps.html),[部分论文](http://web.media.mit.edu/~minsky/abstracts.html)\n\n* [《The Only UX Reading List Ever》](https://medium.com/interactive-mind/the-only-ux-reading-list-ever-d420edb3f4ff)\n\n介绍:与用户打交道的工作都不容易,对象不是一台冷冰冰的机器。而是一位热情澎湃的客人,好的产品总是会留在用户的记忆里。推荐用户体验阅读列表，此外推荐[goodui](http://goodui.org)\n\n* [《Introducing JavaScript Tips》](https://github.com/loverajoel/jstips)\n\n介绍:每日一js tip\n\n* [《xss；Google Code Playground - Path Traversal》](http://blog.bentkowski.info/2014/04/google-code-playground-path-traversal.html?view=sidebar)\n\n介绍:xss教程\n\n* [《Sci-Hub》](http://sci-hub.io)\n\n介绍:论文全文下载——学术界的\"海盗湾\",[mirror](http://sci-hub.cc/)\n\n* [《University of California Berkeley database systems research HomePage》](http://db.cs.berkeley.edu/)\n\n介绍:加利福尼亚州伯克利的大学数据库研究室主页\n\n* [《Publishing at Google》](http://research.google.com/pubs/papers.html)\n\n介绍:Google公开发表的论文列表:数据挖掘,机器学习,自然语言处理,分布式系统,机器翻译,经济与电子商务,教育创新,自然科学,硬件,机器感知,网络,移动网络,量子计算,信息安全,软件工程,语音处理,信息检索,算法与理论.\n\n* [《CS 268: Computer Networks, Fall 2010: Syllabus》](http://www.cs.berkeley.edu/~istoica/classes/cs268/10/)\n\n介绍:计算机网络课程\n\n* [《CS 294: Special Topic in Cryptography: Secure Computation (Spring 2016)》](http://www.cs.berkeley.edu/~sanjamg/classes/cs294-spring16/)\n\n介绍:[Sanjam Garg](http://www.cs.berkeley.edu/~sanjamg/?_ga=1.215305104.642570653.1455594431)是一位密码学研究者,这个最近在伯克利大学新开的课程\n\n* [《30 Days of Swift》](https://github.com/allenwong/30DaysofSwift)\n\n介绍:自学 iOS - 三十天三十个 Swift 项目[文章](http://weibo.com/ttarticle/p/show?id=2309403942494873235448),作者时来源与国外的[Sam Lu](https://medium.com/@samvlu/100-days-of-swift-736d45a19b63)的[100 Days of Swift](http://samvlu.com/)启发开始编写,目前代码已经开源,100 days项目推荐[Swift_100days](https://github.com/Nododo/Swift_100days),[100DaysOfSwift](https://github.com/khuong291/100DaysOfSwift)\n\n* [《Readings in Database Systems, 5th Edition》](http://www.redbook.io/)\n\n介绍:数据库领域红宝书重出江湖。《Readings in Database Systems, 5th Edition》评注版 Peter Bailis, Joseph M. Hellerstein, Michael Stonebraker编著。十年之后，内容大变，传统数据库架构彻底重写，bigdata浪潮影响深远，数据库领域必看书籍\n\n* [《Complete Beginner’s Guide to Interaction Design》](http://www.uxbooth.com/articles/complete-beginners-guide-to-interaction-design/)\n\n介绍:给交互设计初学者的完全自学指南,更重要的是文章末尾的设计师twitter,如果你学习交互设计可以关注[UXbooth](http://www.uxbooth.com/)\n\n* [《Emiller's Guide To Nginx Module Development》](http://www.evanmiller.org/nginx-modules-guide.html)\n\n介绍:Nginx模块编写指南,[译文](http://www.oschina.net/translate/nginx-modules-guide)\n\n* [《Global Database researcher list》](https://aminer.org/search/t=b&q=Database)\n\n介绍:全球数据库领域研究者列表,[DB应用领域专家](http://www.toadworld.com/p/resources-experts)\n\n* [《JavaScript Guide》](https://www.codementor.io/learn-javascript-online)\n\n介绍:JavaScript学习指南\n\n* [《Understanding DevOps》](https://sdarchitect.wordpress.com/understanding-devops/)\n\n介绍:运维从入门者到深入\n\n* [《High Performance Web Sites:14 Rules for Faster-Loading Web Sites》](http://stevesouders.com/hpws/rules.php)\n\n介绍:高性能网站的14条优化规则。\n\n* [《Papers we love》](https://github.com/papers-we-love/papers-we-love)\n\n介绍:涉及领域涵盖了分布式，操作系统，android，信息安全，存储，编程语言等多个方面的论文\n\n* [《ebook:Database Systems: The Complete Book》](http://people.inf.elte.hu/nikovits/DB2/Ullman_The_Complete_Book.pdf)\n\n介绍:数据库系统实现原书第二版,斯坦福大学sql入门教材\n\n* [《Advanced Linux Programming》](http://advancedlinuxprogramming.com/)\n\n介绍:Linux高级编程电子版。\n\n* [《Linux inside》](https://github.com/0xAX/linux-insides)\n\n介绍:Linux内部原理分析。\n\n* [《Cracking the coding interview--问题与解答》](http://www.hawstein.com/posts/ctci-solutions-contents.html)\n\n介绍:Cracking the coding interview问题解答[github](https://github.com/Hawstein/cracking-the-coding-interview)。\n\n* [《Good Copy • Email copy from great companies》](http://www.goodemailcopy.com/)\n\n介绍:如果不会写商业邮件，可以看看国外优秀的公司是如何写的。\n\n* [《CIS 198: Rust Programming》](http://cis198-2016s.github.io/schedule/)\n\n介绍:如果要学习 Rust 语言，可以参考 University of Pennsylvania 2016 年春季这门课程 O网页链接 。除了作业，还应该写点实际的东西。可以看看这个试图用 Rust 重新实现 [GNU Coreutils的项目](https://github.com/uutils/coreutils)。一举两得：熟悉了 Rust 语言；理解常用那些应用的实现原理。\n\n* [《CS:3820 Programming Language Concepts Spring 2016》](http://homepage.cs.uiowa.edu/~achampion/teaching/plc/lectures.shtml)\n\n介绍:University of Iowa 2016 年春季课程 Programming Language Concepts，以 Rust 作为教学语言。\n\n* [《InfoSec Engineering Reading List》](https://github.com/jacobian/infosec-engineering)\n\n介绍:信息安全工程师阅读清单。\n\n* [《Everything you need to kick ass on your coding interview》](https://github.com/andreis/interview)\n\n介绍:面试知识集锦。\n\n* [《10 Technical Papers Every Programmer Should Read (At Least Twice)》](http://blog.fogus.me/2011/09/08/10-technical-papers-every-programmer-should-read-at-least-twice/)\n\n介绍:每个程序员至少读两次以上的论文,来自[reddit](https://www.reddit.com/r/programming/comments/80mi8/10_papers_every_programmer_should_read_at_least/)推荐,应该读[系列1](https://www.reddit.com/r/compsci/comments/mjncj/what_are_some_articles_that_every_computer/)、[系列2](https://www.reddit.com/r/coding/comments/2pu6xw/technical_papers_every_programmer_should_read_at/)。\n\n* [《The Beckman Database Research Self-Assessment Meeting》](http://beckman.cs.wisc.edu/)\n\n介绍:贝克曼数据库研究自我评估会议主页，集结了数据库领域专家的议题。\n\n* [《Swift reusable code》](https://github.com/carlbutron/Swift)\n\n介绍:常用的Swift 工具代码，主要是会经常使用到的。\n\n* [《Memory Deep Dive Series》](http://frankdenneman.nl/2015/02/18/memory-configuration-scalability-blog-series/)\n\n介绍:Memory Deep Dive Series\n\n* [《Engineering blogs》](https://github.com/kilimchoi/engineering-blogs)\n\n介绍:工程师博客列表。[Awesome dev blogs](https://github.com/abdelhai/awesome-dev-blogs)\n\n* [《NoSQL Databases: a Survey and Decision Guidance》](https://medium.baqend.com/nosql-databases-a-survey-and-decision-guidance-ea7823a822d#.kcje9fcho)\n\n介绍:NoSQL数据库：调查和决策指导。非常详细的NoSQL数据库大检阅，文章很长，干货多多\n\n* [《Redis内部数据结构详解》](http://zhangtielei.com/posts/server.html)\n\n介绍:skiplist,quicklist,ziplist,robj,sds,dict等数据结构详解，可以参考[Redis 设计与实现](http://redisbook.com/)\n\n* [《Research at Facebook》](https://research.facebook.com/publications/)\n\n介绍:Facebook的研究博客，有很多公开的优秀论文，大部分都是工业界实践之后的产物,[google research](http://research.google.com/pubs/papers.html)更丰富。[Akamai Publications](https://www.akamai.com/us/en/our-thinking/technical-publications.jsp)\n\n* [《What Every Programmer Should Know About Memory》](https://www.akkadia.org/drepper/cpumemory.pdf)\n\n介绍:内存结构与理论深入分析\n\n* [《The Flame Graph》](http://queue.acm.org/detail.cfm?id=2927301)\n\n介绍:🔥火焰图分析系统性能瓶颈\n\n* [《List of single-file C/C++ libraries》](https://github.com/nothings/single_file_libs)\n\n介绍:单个文件C/C++库指的是那些能移植到多个平台、32位或者64位、从C或者C++中调用、依赖最小的开源库，本文分门别类作了总结。\n\n* [《The System Design Primer》](https://github.com/donnemartin/system-design-primer)\n\n介绍:大规模系统设计指南.从入门到深入.系统架构师必读\n\n* [《Google Interview University》](https://github.com/jwasham/coding-interview-university)\n\n介绍:一套完整的学习手册帮助自己准备 Google 的面试\n\n* [《Videos from all editions of PolyConf》](https://www.youtube.com/user/polyconf)\n\n介绍:所有PolyConf版本的视频。PolyConf是一个为期三天、多学科的高级技术会议，面向有兴趣的多语言软件开发方案的程序员。\n\n* [《On Designing and Deploying Internet-Scale Services》](https://www.usenix.org/legacy/event/lisa07/tech/full_papers/hamilton/hamilton_html/)\n\n介绍:这是一篇关于如何设计和运营（部署）一个大规模互联网系统的总结性质的论文，主要是自动化、监控、容错、让一切变得简单。\n\n* [《SRE conf2016 Conference Program》](https://www.usenix.org/conference/srecon16/program)\n\n介绍:SRE conf2016会议视频与PPT，主要是集中在工程管理方面。例如监控的重要性，面对混乱如何乱而不是方寸。和Google出版的sre可以对比阅读，比较适合基数管理层\n\n* [《Ask HN: What was the best CS paper you read in 2017?》](https://news.ycombinator.com/item?id=16035402)\n\n介绍:HN上面关于2017年读过最好的计算机科学论文的总结问答，问答中揽括了一些理论并且有促进意义的论文。譬如索引的学习，系统设计、软件工程等\n\n* [《CMU15-721:Advanced Database Systems》](http://15721.courses.cs.cmu.edu/spring2017/schedule.html)\n\n介绍:卡内基梅隆大学高级数据库系统课程，拥有课件和视频。课程内容有，并发控制(MVCC、OCC)、LTOP、优化器、数据压缩、执行和调度、并行join\n\n* [《AMPLab paper set》](https://amplab.cs.berkeley.edu/publication)\n\n介绍:加州大学伯克利学校AMPLab实验室论文集合\n\n* [《Online, Asynchronous Schema Change in F1》](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41376.pdf)\n\n介绍:在线异步修改表结构，本文讲述Google F1 在线表结构更改算法逻辑。核心思想是把scheme的修改由一步变为四步：`absent --> delete only --> write only --(reorg)--> public`.中文版参考可以阅读[异步 schema 变更\n](https://github.com/zimulala/builddatabase/blob/master/f1/schema-change.md)、[TiDB 的异步 schema 变更实现](http://zimulala.github.io/2016/02/02/schema-change-implement/)\n\n* [《Writing an OS in Rust (Second Edition)》](https://os.phil-opp.com/)\n\n介绍: 用Rust写一个操作系统系列文章。\n\n* [《Competitive Programmer’s Handbook》](https://cses.fi/book/book.pdf)\n\n介绍: 开源书籍，程序员竞争知识手册。\n\n* [《Paper we love》](https://github.com/papers-we-love/papers-we-love)\n\n介绍: 计算机科学界的论文阅读和讨论。\n\n* [《6.S081: Operating System Engineering》](https://pdos.csail.mit.edu/6.828)\n\n介绍: 麻省理工学院操作系统课程，教你一步步构建一个微型操作系统\n\n* [《Operating Systems: Three Easy Pieces》](http://pages.cs.wisc.edu/~remzi/OSTEP/)\n\n介绍: 威斯康星大学出版的操作系统书籍，把操作系统分为三部分：虚拟化、并发、持久化。对于自学操作系统很受益。原文写的通俗易懂，没有晦涩难懂的词藻。配合留下来的课堂作业能巩固通过看书了解到的知识\n"
  },
  {
    "path": "db.md",
    "content": "## 数据库系统(Database System)资料\n\n- [书籍](#书籍)\n- [课程](#课程)\n- 进程管理\n- [查询/优化器](#查询/优化器)\n- [存储](#存储)\n- [事务](#事务)\n- 共享组件\n- [关系模型](#关系模型)\n- [NewSQL](#NewSQL)\n- [学者](#学者)\n- [其他](#其他)\n\n\n\n#### 书籍\n\n- [《Database System Concepts》](https://kakeboksen.td.org.uit.no/Database%20System%20Concepts%206th%20edition.pdf)\n\n介绍：经典书籍，数据库系统概念。数据库领域的殿堂级作品。夯实数据库理论基础，增强数据库技术内功的必备之选。内容涉及很广：表、SQL、关系模型、事务、数据库设计、分布式、存储、索引、查询处理与优化、并发、数据库分析（postgresql,SQL server）。书的难度系数对于刚刚入门的同学可能不太适合，但可以当作\"词典”。配套书籍[网站](https://www.db-book.com/).\n\n- [《A First Course in Database Systems》](http://infolab.stanford.edu/~ullman/fcdb.html)\n\n介绍：经典书籍，数据库系统基础教程。讲述关系数据模型、ER图、约束与触发器、SQL、视图。适合入门数据库系统的同学。\n\n- [《Architecture of a Database System》](http://db.cs.berkeley.edu/papers/fntdb07-architecture.pdf)\n\n介绍：剖析数据系统内部架构，本文一共包括 8 章，分别是：第 1 章概述，第 2 章进程模型，第 3 章并行体系结构：进程和内存协调，第 4 章关系查询处理器，第 5 章存储管理，第 6 章事务：并发控制和恢复，第 7 章共享组件，第 8 章结束语。[中文版](http://dblab.xmu.edu.cn/wp-content/uploads/old/files/linziyu-Architecture%20of%20a%20Database%20System(Chinese%20Version)-ALL.pdf)由厦门大学数据库实验室翻译\n\n- [《Readings in Database Systems, 5th Edition》](http://www.redbook.io/)\n\n介绍：数据库领域红宝书重出江湖。《Readings in Database Systems, 5th Edition》评注版 Peter Bailis, Joseph M. Hellerstein, Michael Stonebraker编著。十年之后，内容大变，传统数据库架构彻底重写，bigdata浪潮影响深远，数据库领域必看书籍。里面包含有数据挖掘、查询优化、数据库语言.\n\n- [《Database System Implementation》](http://infolab.stanford.edu/~ullman/dbsi.html)\n\n介绍：斯坦福大学本科教材，这本阐述了实现关系数据库系统各个层面的关键技术。主要分为三部分：存储管理器、查询处理器和事务管理器的实现技术。书中从存储，Index，SQL compiler，optimizer, log，事务等关键技术。不太适合数据库入门初学者，理论很多信息量大。[英文版](https://people.inf.elte.hu/miiqaai/elektroModulatorDva.pdf)\n\n#### 课程\n\n- [《CMU 15-721 (SPRING 2018) Advanced Database Systems》](https://15721.courses.cs.cmu.edu/spring2018/)\n\n介绍：卡内基梅隆2018年春季高级数据库课程，对现代数据库管理系统内部的全面研究。它将涵盖高性能事务处理系统（OLTP）和大规模分析系统（OLAP）中的组件核心概念和基础知识。它的[阅读列表](https://15721.courses.cs.cmu.edu/spring2018/schedule.html#jan-24-2018)、[课堂笔记](https://15721.courses.cs.cmu.edu/spring2018/notes/)、[课件](https://15721.courses.cs.cmu.edu/spring2018/slides/)都已经开放。并且提供了[视频](https://www.youtube.com/playlist?list=PLSE8ODhjZXjYplQRUlrgQKwIAV3es0U6t)\n\n- [《6.830/6.814: Database Systems》](http://db.csail.mit.edu/6.830/)\n\n介绍：麻省理工学院数据库系统的一门核心课程。由数据库[Samuel Madden教授](http://db.csail.mit.edu/madden/)[DB Lab](http://db.csail.mit.edu/)推出的课程。前半部分比较基础的数据库的知识包含关系代数、数据模型、范式、查询优化、事务，后半段主要在讲分布式数据库，讲如何达到数据一致性，也是database比较火的研究方向。\n\n- [《Use and realization of database systems》](https://db.in.tum.de/teaching/ss19/impldb/?lang=en)\n\n介绍：使用并且实现一个数据库系统，这门课程是德国慕尼黑工业大学开设，包含两部分：实现和使用。内容有：事务管理、错误处理、多用户同步、数据的结构、请求处理、分布式数据库、OLTP/OLAP、XML、性能评估。\n\n\n#### 查询/优化器\n\n- [《How to Architect a Query Compiler, Revisited》](https://www.cs.purdue.edu/homes/rompf/papers/tahboub-sigmod18.pdf)\n\n介绍：本篇论文讲述如何架构一个查询编译器，SQL如何被执行、查询评估、如何处理并行执行、查询器的优化、以及最后的[TPC](http://www.tpc.org/information/benchmarks.asp)测试。\n\n- [《Improved Query Performance with Variant Indexes》](http://ilpubs.stanford.edu:8090/253/1/1997-40.pdf)\n\n介绍：分析型数据库和OLTP数据库需要不同的利弊权衡方式。这反映在索引数据结构的选择上。此文讨论了许多更适合分析型数据库的索引数据结构。\n\n- [《The Case for Learned Index Structures》](https://arxiv.org/abs/1712.01208)\n\n介绍：Google利用深度学习改善索引创建，提交查询效率\n\n\n#### 事务\n\n- [《Transaction Systems》](https://db.in.tum.de/teaching/ss19/transactions/?lang=en)\n\n介绍：这门课程是德国慕尼黑工业大学开设的关于数据库事务课程。内容有：计算模型、并发控制算法、多版本并发控制、并发控制在对象/查询结构/关系数据库的应用、事务恢复、page恢复算法、如何实现。主要是课件\n\n- [《Generalized Isolation Level Definitions》](http://pmg.csail.mit.edu/papers/icde00.pdf)\n\n介绍：事务隔离是数据库系统设计中根本的组成部分，本文主要从标准层面来讨论隔离级别的划分方式，先解释事务隔离分级的原因以及标准制定的目标；之后概述其发展历史；最后介绍Atul Adya给出的比较合理的隔离级别定义。参考[序列化](http://blog.kongfy.com/2019/03/serializable/)\n\n- [《Percolator: Large-scale Incremental Processing Using Distributed Transactions and Notifications》](https://storage.googleapis.com/pub-tools-public-publication-data/pdf/36726.pdf)    \n\n介绍：Percolator是由Google公司开发的、为大数据集群进行增量处理更新的系统，主要用于google网页搜索索引服务。使用基于Percolator的增量处理系统代替原有的批处理索引系统后，Google在处理同样数据量的文档时，将文档的平均搜索延时降低了50%。[笔记参考](http://andremouche.github.io/transaction/percolator.html)\n\n- [《Improving Optimistic Concurrency Control Through Transaction Batching and Operation Reordering》](http://www.vldb.org/pvldb/vol12/p169-ding.pdf)\n\n介绍：通过事务批量和操作的重排序来提高乐观并发控制性能\n\n- [《Omid: Lock-free transactional support for distributed data stores》]\n\n介绍：Omid一种无锁分布式事务，它是Yahoo公司研发的在大规模分布式存储之上提供事务功能的组件，每隔一段时间都会发布一篇论文。分别是[《Taking Omid to the Clouds》](https://webee.technion.ac.il/~idish/ftp/p842-shacham.pdf)，[《Omid, Reloaded: Scalable and Highly-Available Transaction Processing》](https://www.usenix.org/system/files/conference/fast17/fast17-shacham.pdf)。阅读时推荐和Google发表的Percolator论文一起阅读\n\n- [《Concurrency Control and Recovery in Database Systems》](https://www.microsoft.com/en-us/research/people/philbe/book/)\n\n介绍：经典书籍，讨论数据库的并发控制和恢复。序列化、两阶段锁、MVCC、分布式数据恢复、数据复制\n\n- [《A Critique of ANSI SQL Isolation Levels》](https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/tr-95-51.pdf)\n\n介绍：对ANSI SQL 隔离级别的批评。ANSI SQL-92 提出了最经典的隔离级别定义，包括读未提交（Read Uncommitted）、读提交（Read Committed）、可重复读（Repeatable Read）和可序列化（Serializable）。本文显示，这些phenomena和ANSI SQL定义无法正确表征几个流行的隔离级别，包括对于不同隔离级别标准的锁实现。本文调查了phenomena说明中的歧义，并提出了更正式的说明;此外，介绍了更好地表征隔离类型的新phenomena。最后，定义了一个称为快照隔离的重要的多版本隔离类型。\n\n- [《Generalized Isolation Level Definitions》](http://pmg.csail.mit.edu/papers/icde00.pdf)\n\n介绍：这篇文章，指出了此前对隔离级别定义重度依赖数据库的实现，并且提出了与实现无关的隔离级别定义。\n\n- [《Serializable Snapshot Isolation in PostgreSQL》](https://drkp.net/papers/ssi-vldb12.pdf)\n\n介绍：快照隔离首先是在《A Critique of ANSI SQL Isolation Levels 》中被提出。本文主要讲述PostgreSQL中基于 Snapshot Isolation 的可串行化实现。\n\n#### 关系模型\n\n- [《Course Introduction and the Relational Model》](https://15445.courses.cs.cmu.edu/fall2019/schedule.html#aug-26-2019)    \n\n介绍：CMU 数据课程，讲述数据库关系模型\n\n#### NewSQL\n\n- [《Spanner: Becoming a SQL System》](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/46103.pdf)    \n\n介绍：这本论文主要是讲述[Spanner](https://storage.googleapis.com/pub-tools-public-publication-data/pdf/65b514eda12d025585183a641b5a9e096a3c4be5.pdf)的之所以能成功的一些工程经验。如何为一个强大的分布式数据库内核添加SQL支持，如何处理并发问题。其中还列举出了两个案例：分布式中TOPK问题、JOIN随机读问题。\n\n- [《Fast Scans on Key-Value Stores》](http://www.vldb.org/pvldb/vol10/p1526-bocksrocker.pdf)    \n\n介绍：vldb2019年会议论文，如何构建可快速查询的KV存储系统.讲述了KV系统构建时的权衡.该篇是作者博士论文[<Tell: An Elastic Database System for Mixed Workloads>](https://www.systems.ethz.ch/sites/default/files/file/UpcomingPublications/PilmanMarkus2016.pdf)的精简版\n\n- [《Online, Asynchronous Schema Change in F1》](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41376.pdf)\n\n介绍：在线异步执行F1 DDL操纵.F1团队提出了一种安全的Schema变更算法。本文将先简单介绍KV存储引擎的提供的接口，然后分析异步的Schema变更导致的问题，最后再描述F1的Schema变更算法以及其限制点。参考阅读[异步 schema 变更](https://github.com/ngaut/builddatabase/blob/master/f1/schema-change.md)。[TiDB 的异步 schema 变更实现](https://github.com/ngaut/builddatabase/blob/master/f1/schema-change-implement.md)\n\n\n- [《Amazon Aurora: Design Considerations for High Throughput Cloud-Native Relational Databases》](https://www.allthingsdistributed.com/files/p1041-verbitski.pdf)    \n\n介绍：Aurora是一个 OLTP 的关系型数据库。这篇论文描述Aurora架构和设计时的考量。高吞吐的数据处理瓶颈，已经从计算和存储，转移到了网络。Aurora的主要是为了解决多租户scale-out、共享存储、网络瓶颈。[阅读笔记](http://www.zenlife.tk/aurora.md)、[Amazon Aurora: 云原生关系数据库的设计](https://www.allthingsdistributed.com/2019/03/Amazon-Aurora-design-cloud-native-relational-database.html)\n\n- [《Automatically Indexing Millions of Databases in Microsoft Azure SQL Database》](https://www.microsoft.com/en-us/research/uploads/prod/2019/02/autoindexing_azuredb.pdf)    \n\n介绍：vldb2019年会议论文，本文重点讨论了Azure的自动索引推荐系统，讨论了整个过程的细节和反馈。[相关笔记](https://zhuanlan.zhihu.com/p/62628781)\n\n- [《A Lightweight and Efficient Temporal Database Management System in TDSQL》](http://www.vldb.org/pvldb/vol12/p2035-lu.pdf)    \n\n介绍：本文详细讲述了腾讯分布式数据库TDSQL的实现细节和考量\n\n- [《AnalyticDB: Real-time OLAP Database System at Alibaba Cloud》](http://www.vldb.org/pvldb/vol12/p2059-zhan.pdf)    \n\n介绍：AnalyticDB是阿里云构建的OLAP分布式计算数据库，是一种存储和计算分离的架构。在论文中，提到了和阿里基础设施服务盘古和伏羲的结合，并且在此基础上面做的一些工作。论文中有很多大胆的设计，例如所有列都有索引，减少用户的索引维护成本。读写分离，读节点定时拉，写节点主动下推。\n\n- [《PushdownDB: Accelerating a DBMS using S3 Computation》](https://arxiv.org/pdf/2002.05837.pdf)    \n\n介绍：这篇论文主要讲述PushdownDB 如何利用AWS S3做为存储组件。把DBMS的一些过滤、聚合、映射下发至S3并得到响应结果。其实利用S3用于底层存储AWS 在Aurora就有实现。\n\n#### 学者\n\n- [《Daniel Abadi》](https://www.cs.umd.edu/~abadi/)    \n\n介绍：卡内基梅隆的Daniel Abadi教授，HadoopDB的作者。他的[博客](http://dbmsmusings.blogspot.com/) 质量很高。譬如[讨论事务隔离级别](http://dbmsmusings.blogspot.com/2019/05/introduction-to-transaction-isolation.html)、[2阶段提交](http://dbmsmusings.blogspot.com/2019/01/its-time-to-move-on-from-two-phase.html)\n\n#### 存储\n\n- [《X-Engine: An Optimized Storage Engine for Large-Scale E-Commerce Transaction Processing》](https://dl.acm.org/citation.cfm?id=3314041)    \n\n介绍：这篇论文介绍了阿里云面向大规模流量场景设计的自研存储引擎X-Engine，设计采用分层存储的全新理念，可以根据数据访问频度将数据合理归位，实现快存快取。POLARDB是基于x-engine\n\n\n\n#### 其他\n\n- [《Readings in Databases》](https://github.com/rxin/db-readings)\n\n介绍：Apache Spark作者[Reynold Xin](http://twitter.com/rxin)推荐的数据库阅读清单\n\n- [《Awesome Database Learning》](https://github.com/pingcap/awesome-database-learning)\n\n介绍：PingCAP下面的数据库学习资料repository. \n\n- [《VLDB Proceedings of the VLDB Endowment,2019-2020 》](http://www.vldb.org/pvldb/vol13.html)\n\n介绍：2019-2020年著名数据库顶级会议之一的VLDB投稿论文列表，论文涵盖：测试、机器学习、数据存储、查询、图、索引、大数据领域等。\n"
  },
  {
    "path": "dl.md",
    "content": "## 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1)\n\n##### 注:机器学习资料[篇目一](https://github.com/ty4z2008/Qix/blob/master/dl.md)共500条,[篇目二](https://github.com/ty4z2008/Qix/blob/master/dl2.md)开始更新\n\n##### 希望转载的朋友，你可以不用联系我．但是**一定要保留原文链接**，因为这个项目还在继续也在不定期更新．希望看到文章的朋友能够学到更多．此外:某些资料在中国访问需要梯子.\n\n\n\n* [《Brief History of Machine Learning》](http://www.erogol.com/brief-history-machine-learning/)\n\n介绍:这是一篇介绍机器学习历史的文章，介绍很全面，从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning.\n\n* [《Deep Learning in Neural Networks: An Overview》](http://www.idsia.ch/~juergen/DeepLearning15May2014.pdf)\n\n介绍:这是瑞士人工智能实验室Jurgen Schmidhuber写的最新版本《神经网络与深度学习综述》本综述的特点是以时间排序，从1940年开始讲起，到60-80年代，80-90年代，一直讲到2000年后及最近几年的进展。涵盖了deep learning里各种tricks，引用非常全面.\n\n* [《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》](http://machinelearningmastery.com/a-gentle-introduction-to-scikit-learn-a-python-machine-learning-library/)\n\n介绍:这是一份python机器学习库,如果您是一位python工程师而且想深入的学习机器学习.那么这篇文章或许能够帮助到你.\n\n* [《How to Layout and Manage Your Machine Learning Project》](http://machinelearningmastery.com/how-to-layout-and-manage-your-machine-learning-project/)\n\n介绍:这一篇介绍如果设计和管理属于你自己的机器学习项目的文章，里面提供了管理模版、数据管理与实践方法.\n\n* [《Machine Learning is Fun!》](https://medium.com/code-poet/80ea3ec3c471)\n\n介绍:如果你还不知道什么是机器学习，或则是刚刚学习感觉到很枯燥乏味。那么推荐一读。这篇文章已经被翻译成中文,如果有兴趣可以移步http://blog.jobbole.com/67616/\n\n\n* [《R语言参考卡片》](http://cran.r-project.org/doc/contrib/Liu-R-refcard.pdf)\n\n介绍:R语言是机器学习的主要语言,有很多的朋友想学习R语言，但是总是忘记一些函数与关键字的含义。那么这篇文章或许能够帮助到你\n\n* [《Choosing a Machine Learning Classifier》](http://blog.echen.me/2011/04/27/choosing-a-machine-learning-classifier/)\n\n介绍:我该如何选择机器学习算法，这篇文章比较直观的比较了Naive Bayes，Logistic Regression，SVM，决策树等方法的优劣，另外讨论了样本大小、Feature与Model权衡等问题。此外还有已经翻译了的版本:http://www.52ml.net/15063.html\n\n* [《An Introduction to Deep Learning: From Perceptrons to Deep Networks》](http://www.toptal.com/machine-learning/an-introduction-to-deep-learning-from-perceptrons-to-deep-networks)\n\n介绍：深度学习概述：从感知机到深度网络，作者对于例子的选择、理论的介绍都很到位，由浅入深。翻译版本：http://www.cnblogs.com/xiaowanyer/p/3701944.html\n\n* [《The LION Way: Machine Learning plus Intelligent Optimization》](http://vdisk.weibo.com/s/ayG13we2vxyKl)\n\n 介绍:<机器学习与优化>这是一本机器学习的小册子, 短短300多页道尽机器学习的方方面面. 图文并茂, 生动易懂, 没有一坨坨公式的烦恼. 适合新手入门打基础, 也适合老手温故而知新. 比起MLAPP/PRML等大部头, 也许这本你更需要!具体内容推荐阅读:http://intelligent-optimization.org/LIONbook/ \n\n* [《深度学习与统计学习理论》](http://php-52cs.rhcloud.com/?cat=7)\n\n介绍:作者是来自百度，不过他本人已经在2014年4月份申请离职了。但是这篇文章很不错如果你不知道深度学习与支持向量机/统计学习理论有什么联系？那么应该立即看看这篇文章.\n\n* [《计算机科学中的数学》](http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-042j-mathematics-for-computer-science-fall-2010/readings/MIT6_042JF10_notes.pdf)\n\n介绍:这本书是由谷歌公司和MIT共同出品的计算机科学中的数学：[Mathematics for Computer Science](Mathematics for Computer Science)，Eric Lehman et al 2013 。分为5大部分：1）证明，归纳。2）结构，数论，图。3）计数，求和，生成函数。4）概率，随机行走。5）递归。等等\n\n* [《信息时代的计算机科学理论(Foundations of Data Science)》](http://research.microsoft.com/en-US/people/kannan/book-no-solutions-aug-21-2014.pdf)\n\n介绍：信息时代的计算机科学理论,目前国内有纸质书购买，[iTunes购买](https://itunes.apple.com/us/book/introduction-to-data-science/id529088127)\n\n* [《Data Science with R》](http://vdisk.weibo.com/s/ayG13we2vx5qg)\n\n介绍:这是一本由雪城大学新编的第二版《数据科学入门》教材：偏实用型，浅显易懂，适合想学习R语言的同学选读。\n\n* [《Twenty Questions for Donald Knuth》](http://www.informit.com/articles/article.aspx?p=2213858)\n\n介绍:这并不是一篇文档或书籍。这是篇向图灵奖得主Donald Knuth提问记录稿： 近日， Charles Leiserson, Al Aho, Jon Bentley等大神向Knuth提出了20个问题，内容包括TAOCP，P/NP问题，图灵机，逻辑，以及为什么大神不用电邮等等。\n\n* [《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》](http://arxiv.org/pdf/1402.4304v2.pdf)\n\n介绍：不会统计怎么办？不知道如何选择合适的统计模型怎么办？那这篇文章你的好好读一读了麻省理工Joshua B. Tenenbaum和剑桥Zoubin Ghahramani合作，写了一篇关于automatic statistician的文章。可以自动选择回归模型类别，还能自动写报告...\n\n* [《ICLR 2014论文集》](http://openreview.net/venue/iclr2014)\n\n介绍:对深度学习和representation learning最新进展有兴趣的同学可以了解一下\n\n* [《Introduction to Information Retrieval》](http://www-nlp.stanford.edu/IR-book/)\n\n介绍：这是一本信息检索相关的书籍，是由斯坦福Manning与谷歌副总裁Raghavan等合著的Introduction to Information Retrieval一直是北美最受欢迎的信息检索教材之一。最近作者增加了该课程的幻灯片和作业。IR相关资源：http://www-nlp.stanford.edu/IR-book/information-retrieval.html\n\n* [《Machine learning in 10 pictures》](http://www.denizyuret.com/2014/02/machine-learning-in-5-pictures.html)\n\n介绍:Deniz Yuret用10张漂亮的图来解释机器学习重要概念：1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰\n\n* [《雅虎研究院的数据集汇总》](http://webscope.sandbox.yahoo.com/catalog.php?datatype=l)\n\n介绍：雅虎研究院的数据集汇总： 包括语言类数据，图与社交类数据，评分与分类数据，计算广告学数据，图像数据，竞赛数据，以及系统类的数据。\n\n* [《An Introduction to Statistical Learning with Applications in R》](http://www-bcf.usc.edu/~gareth/ISL/)\n\n介绍：这是一本斯坦福统计学著名教授Trevor Hastie和Robert Tibshirani的新书，并且在2014年一月已经开课：https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about\n\n* [Best Machine Learning Resources for Getting Started](http://machinelearningmastery.com/best-machine-learning-resources-for-getting-started/)\n\n介绍：机器学习最佳入门学习资料汇总是专为机器学习初学者推荐的优质学习资源，帮助初学者快速入门。而且这篇文章的介绍已经被翻译成[中文版](http://article.yeeyan.org/view/22139/410514)。如果你不怎么熟悉，那么我建议你先看一看中文的介绍。\n\n* [My deep learning reading list](http://blog.sina.com.cn/s/blog_bda0d2f10101fpp4.html)\n\n介绍:主要是顺着Bengio的PAMI review的文章找出来的。包括几本综述文章，将近100篇论文，各位山头们的Presentation。全部都可以在google上找到。\n\n* [Cross-Language Information Retrieval](http://www.morganclaypool.com/doi/abs/10.2200/S00266ED1V01Y201005HLT008?journalCode=hlt)\n\n介绍：这是一本书籍，主要介绍的是跨语言信息检索方面的知识。理论很多\n\n* [探索推荐引擎内部的秘密，第 1 部分: 推荐引擎初探](http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html?ca=drs-)\n\n介绍:本文共有三个系列，作者是来自IBM的工程师。它主要介绍了推荐引擎相关算法，并帮助读者高效的实现这些算法。 [探索推荐引擎内部的秘密，第 2 部分: 深度推荐引擎相关算法 - 协同过滤](http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html?ca=drs-),[探索推荐引擎内部的秘密，第 3 部分: 深度推荐引擎相关算法 - 聚类](http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy3/index.html?ca=drs-)\n\n\n* [《Advice for students of machine learning》](http://mimno.infosci.cornell.edu/b/articles/ml-learn/)\n\n介绍：康奈尔大学信息科学系助理教授David Mimno写的《对机器学习初学者的一点建议》， 写的挺实际，强调实践与理论结合，最后还引用了冯 • 诺依曼的名言: \"Young man, in mathematics you don't understand things. You just get used to them.\"\n\n* [分布式并行处理的数据](http://web.stanford.edu/group/pdplab/pdphandbook/)\n\n介绍：这是一本关于分布式并行处理的数据《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。着重介绍了各种神级网络算法的分布式实现,做Distributed Deep Learning 的童鞋可以参考下\n\n* [《“机器学习”是什么？》](http://blogs.technet.com/b/machinelearning/archive/2014/07/01/what-is-machine-learning.aspx)\n\n介绍:【“机器学习”是什么？】John Platt是微软研究院杰出科学家，17年来他一直在机器学习领域耕耘。近年来机器学习变得炙手可热，Platt和同事们遂决定开设[博客](http://blogs.technet.com/b/machinelearning/)，向公众介绍机器学习的研究进展。机器学习是什么，被应用在哪里？来看Platt的这篇[博文](http://blogs.technet.com/b/machinelearning/archive/2014/07/01/what-is-machine-learning.aspx)\n\n* [《2014年国际机器学习大会ICML 2014 论文》](http://icml.cc/2014/index/article/15.htm)\n\n介绍：2014年国际机器学习大会（ICML）已经于6月21-26日在国家会议中心隆重举办。本次大会由微软亚洲研究院和清华大学联手主办，是这个有着30多年历史并享誉世界的机器学习领域的盛会首次来到中国，已成功吸引海内外1200多位学者的报名参与。干货很多，值得深入学习下\n\n* [《Machine Learning for Industry: A Case Study》](http://blogs.technet.com/b/machinelearning/archive/2014/07/11/machine-learning-for-industry-a-case-study.aspx)\n\n介绍：这篇文章主要是以Learning to Rank为例说明企业界机器学习的具体应用，RankNet对NDCG之类不敏感，加入NDCG因素后变成了LambdaRank，同样的思想从神经网络改为应用到Boosted Tree模型就成就了LambdaMART。[Chirs Burges](http://research.microsoft.com/en-us/people/cburges/?WT.mc_id=Blog_MachLearn_General_DI)，微软的机器学习大神，Yahoo 2010 Learning to Rank Challenge第一名得主，排序模型方面有RankNet，LambdaRank，LambdaMART，尤其以LambdaMART最为突出，代表论文为：\n[From RankNet to LambdaRank to LambdaMART: An Overview](http://research.microsoft.com/en-us/um/people/cburges/tech_reports/msr-tr-2010-82.pdf)\n此外，Burges还有很多有名的代表作，比如：[A Tutorial on Support Vector Machines for Pattern Recognition](http://research.microsoft.com/pubs/67119/svmtutorial.pdf)    \n[Some Notes on Applied Mathematics for Machine Learning](http://research.microsoft.com/en-us/um/people/cburges/tech_reports/tr-2004-56.pdf)\n\n* [100 Best GitHub: Deep Learning](http://meta-guide.com/software-meta-guide/100-best-github-deep-learning/)\n\n介绍:100 Best GitHub: Deep Learning\n\n* [《UFLDL-斯坦福大学Andrew Ng教授“Deep Learning”教程》](http://www.52ml.net/12019.html)\n\n介绍:本教程将阐述无监督特征学习和深度学习的主要观点。通过学习，你也将实现多个功能学习/深度学习算法，能看到它们为你工作，并学习如何应用/适应这些想法到新问题上。本教程假定机器学习的基本知识（特别是熟悉的监督学习，逻辑回归，梯度下降的想法），如果你不熟悉这些想法，我们建议你去这里[机器学习课程](http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=MachineLearning)，并先完成第II，III，IV章（到逻辑回归）。此外这关于这套教程的源代码在github上面已经有python版本了[ UFLDL Tutorial Code](https://github.com/jatinshah/ufldl_tutorial)\n\n*[《Deep Learning for Natural Language Processing and Related Applications》](http://research.microsoft.com/pubs/217165/ICASSP_DeepTextLearning_v07.pdf)\n\n介绍:这份文档来自微软研究院,精髓很多。如果需要完全理解，需要一定的机器学习基础。不过有些地方会让人眼前一亮,茅塞顿开。\n\n* [Understanding Convolutions](https://colah.github.io/posts/2014-07-Understanding-Convolutions/)\n\n介绍:这是一篇介绍图像卷积运算的文章，讲的已经算比较详细的了\n\n* [《Machine Learning Summer School》](http://mlss2014.com/)\n\n介绍：每天请一个大牛来讲座，主要涉及机器学习，大数据分析，并行计算以及人脑研究。https://www.youtube.com/user/smolix    （需翻墙）\n\n* [《Awesome Machine Learning》](https://github.com/josephmisiti/awesome-machine-learning)\n\n介绍：一个超级完整的机器学习开源库总结，如果你认为这个碉堡了，那后面这个列表会更让你惊讶：【Awesome Awesomeness】,国内已经有热心的朋友进行了翻译[中文介绍](http://blog.jobbole.com/73806/)，[机器学习数据挖掘免费电子书](https://github.com/josephmisiti/awesome-machine-learning/blob/master/books.md)\n\n* [斯坦福《自然语言处理》课程视频](http://cs224d.stanford.edu/syllabus.html)\n\n介绍:ACL候任主席、斯坦福大学计算机系Chris Manning教授的《自然语言处理》课程所有视频已经可以在斯坦福公开课网站上观看了（如Chrome不行，可用IE观看） 作业与测验也可以下载。\n\n* [《Deep Learning and Shallow Learning》](http://freemind.pluskid.org/machine-learning/deep-learning-and-shallow-learning/)\n\n介绍:对比 Deep Learning 和 Shallow Learning 的好文，来着浙大毕业、MIT 读博的 Chiyuan Zhang 的博客。\n\n* [《Recommending music on Spotify with deep learning》](http://benanne.github.io/2014/08/05/spotify-cnns.html)\n\n介绍:利用卷积神经网络做音乐推荐。\n\n* [《Neural Networks and Deep Learning》](http://neuralnetworksanddeeplearning.com/index.html)\n\n介绍：神经网络的免费在线书，已经写了三章了，还有对应的开源代码：https://github.com/mnielsen/neural-networks-and-deep-learning 爱好者的福音。\n\n* [《Java Machine Learning》](http://machinelearningmastery.com/java-machine-learning/)\n\n介绍：Java机器学习相关平台和开源的机器学习库，按照大数据、NLP、计算机视觉和Deep Learning分类进行了整理。看起来挺全的，Java爱好者值得收藏。\n\n* [《Machine Learning Theory: An Introductory Primer》](http://www.oschina.net/translate/6-tips-for-writing-better-code)\n\n介绍：机器学习最基本的入门文章，适合零基础者\n\n* [《机器学习常见算法分类汇总》](http://www.ctocio.com/hotnews/15919.html)\n\n介绍：机器学习的算法很多。很多时候困惑人们都是，很多算法是一类算法，而有些算法又是从其他算法中延伸出来的。这里，我们从两个方面来给大家介绍，第一个方面是学习的方式，第二个方面是算法的类似性。\n\n* [《机器学习经典论文/survey合集》](http://suanfazu.com/discussion/68/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%BB%8F%E5%85%B8%E8%AE%BA%E6%96%87survey%E5%90%88%E9%9B%86)\n\n介绍：看题目你已经知道了是什么内容,没错。里面有很多经典的机器学习论文值得仔细与反复的阅读。\n\n* [《机器学习视频库》](http://work.caltech.edu/library/)\n\n介绍：视频由加州理工学院（Caltech）出品。需要英语底子。\n\n* [《机器学习经典书籍》](http://suanfazu.com/discussion/109/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%BB%8F%E5%85%B8%E4%B9%A6%E7%B1%8D)\n\n介绍：总结了机器学习的经典书籍，包括数学基础和算法理论的书籍，可做为入门参考书单。\n\n* [《16 Free eBooks On Machine Learning》](http://efytimes.com/e1/fullnews.asp?edid=121516)\n\n介绍:16本机器学习的电子书，可以下载下来在pad，手机上面任意时刻去阅读。不多我建议你看完一本再下载一本。\n\n* [《A Large set of Machine Learning Resources for Beginners to Mavens》](http://www.erogol.com/large-set-machine-learning-resources-beginners-mavens/)\n\n介绍:标题很大，从新手到专家。不过看完上面所有资料。肯定是专家了\n\n* [《机器学习最佳入门学习资料汇总》](http://article.yeeyan.org/view/22139/410514)\n\n介绍：入门的书真的很多，而且我已经帮你找齐了。\n\n* [《Sibyl》](http://users.soe.ucsc.edu/~niejiazhong/slides/chandra.pdf)\n\n介绍：Sibyl 是一个监督式机器学习系统，用来解决预测方面的问题，比如 YouTube 的视频推荐。\n\n* [《Neural Network & Text Mining》](http://www.slideshare.net/ssuser9cc1bd/piji-li-dltm)\n\n介绍:关于(Deep) Neural Networks在 NLP 和 Text Mining 方面一些paper的总结\n\n* [《前景目标检测1（总结）》](http://www.cnblogs.com/lxy2017/p/3927226.html)\n\n介绍:计算机视觉入门之前景目标检测1（总结）\n\n* [《行人检测》](http://www.52ml.net/17004.html)\n\n介绍:计算机视觉入门之行人检测\n\n* [《Deep Learning – important resources for learning and understanding》](http://www.kdnuggets.com/2014/08/deep-learning-important-resources-learning-understanding.html)\n\n介绍:Important resources for learning and understanding . Is awesome\n\n* [《Machine Learning Theory: An Introductory Primer》](http://www.toptal.com/machine-learning/machine-learning-theory-an-introductory-primer)\n\n介绍:这又是一篇机器学习初学者的入门文章。值得一读\n\n* [《Neural Networks and Deep Learning》](http://neuralnetworksanddeeplearning.com/)\n\n介绍:在线Neural Networks and Deep Learning电子书\n\n* [《Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱》](http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98)\n\n介绍:python的17个关于机器学习的工具\n\n* [《神奇的伽玛函数(上)》](http://www.flickering.cn/%E6%A6%82%E7%8E%87%E7%BB%9F%E8%AE%A1/2014/06/%E7%A5%9E%E5%A5%87%E7%9A%84%E4%BC%BD%E7%8E%9B%E5%87%BD%E6%95%B0%E4%B8%8A/)\n\n介绍:下集在这里[神奇的伽玛函数(下)](http://www.flickering.cn/%E6%A6%82%E7%8E%87%E7%BB%9F%E8%AE%A1/2014/06/%E7%A5%9E%E5%A5%87%E7%9A%84%E4%BC%BD%E7%8E%9B%E5%87%BD%E6%95%B0%E4%B8%8A/)\n\n* [《分布式机器学习的故事》](http://cxwangyi.github.io/notes/2014-01-20-distributed-machine-learning.html)\n\n介绍:作者王益目前是腾讯广告算法总监，王益博士毕业后在google任研究。这篇文章王益博士7年来从谷歌到腾讯对于分布机器学习的所见所闻。值得细读\n\n* [《机器学习提升之道（Level-Up Your Machine Learning）》](http://metacademy.org/roadmaps/cjrd/level-up-your-ml)\n\n介绍:把机器学习提升的级别分为0~4级，每级需要学习的教材和掌握的知识。这样，给机器学习者提供一个上进的路线图，以免走弯路。另外，整个网站都是关于机器学习的，资源很丰富。\n\n* [《Machine Learning Surveys》](http://www.mlsurveys.com/)\n\n介绍:机器学习各个方向综述的网站\n\n* [《Deep Learning Reading list》](http://deeplearning.net/reading-list/)\n\n介绍:深度学习阅资源列表\n\n* [《Deep Learning: Methods and Applications》](http://research.microsoft.com/pubs/219984/DeepLearningBook_RefsByLastFirstNames.pdf)\n\n介绍：这是一本来自微的研究员 li Peng和Dong Yu所著的关于深度学习的方法和应用的电子书\n\n* [《Machine Learning Summer School 2014》](http://pan.baidu.com/s/1pJ0ok7T)\n\n介绍:2014年七月CMU举办的机器学习夏季课刚刚结束 有近50小时的视频、十多个PDF版幻灯片，覆盖 深度学习，贝叶斯，分布式机器学习，伸缩性 等热点话题。所有13名讲师都是牛人：包括大牛Tom Mitchell （他的［机器学习］是名校的常用教材），还有CMU李沐 .（1080P高清哟）\n\n* [《Sibyl: 来自Google的大规模机器学习系统》](http://users.soe.ucsc.edu/~niejiazhong/slides/chandra.pdf)\n\n介绍:在今年的IEEE/IFIP可靠系统和网络（DSN）国际会议上，Google软件工程师Tushar Chandra做了一个关于Sibyl系统的主题演讲。 Sibyl是一个监督式机器学习系统，用来解决预测方面的问题，比如YouTube的视频推荐。详情请阅读[google sibyl](http://www.infoq.com/cn/news/2014/07/google-sibyl)\n\n* [《Building a deeper understanding of images》](http://googleresearch.blogspot.com/2014/09/building-deeper-understanding-of-images.html)\n\n介绍:谷歌研究院的Christian Szegedy在谷歌研究院的博客上简要地介绍了他们今年参加ImageNet取得好成绩的GoogLeNet系统.是关于图像处理的。\n\n* [《Bayesian network 与python概率编程实战入门》](https://github.com/memect/hao/blob/master/awesome/bayesian-network-python.md)\n\n介绍:贝叶斯学习。如果不是很清可看看[概率编程语言与贝叶斯方法实践](http://www.infoq.com/cn/news/2014/07/programming-language-bayes)\n\n* [《AMA: Michael I Jordan》](http://www.reddit.com/r/MachineLearning/comments/2fxi6v/ama_michael_i_jordan/)\n\n介绍:网友问伯克利机器学习大牛、美国双料院士Michael I. Jordan：\"如果你有10亿美金，你怎么花？Jordan: \"我会用这10亿美金建造一个NASA级别的自然语言处理研究项目。\" \n\n* [《机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）》](http://www.cnblogs.com/tornadomeet/p/3395593.html)\n\n介绍:常见面试之机器学习算法思想简单梳理,此外作者还有一些其他的[机器学习与数据挖掘文章](http://www.cnblogs.com/tornadomeet/tag/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/)和[深度学习文章](http://www.cnblogs.com/tornadomeet/tag/Deep%E3%80%80Learning/),不仅是理论还有源码。\n\n* [《文本与数据挖掘视频汇总》](http://www.kdnuggets.com/2014/09/most-viewed-web-mining-lectures-videolectures.html)\n\n介绍：Videolectures上最受欢迎的25个文本与数据挖掘视频汇总\n\n* [《怎么选择深度学习的GPUs》](http://timdettmers.wordpress.com/2014/08/14/which-gpu-for-deep-learning/)\n\n介绍:在Kaggle上经常取得不错成绩的Tim Dettmers介绍了他自己是怎么选择深度学习的GPUs, 以及个人如何构建深度学习的GPU集群: http://t.cn/RhpuD1G \n\n* [《对话机器学习大神Michael Jordan：深度模型》](http://www.infoq.com/cn/news/2014/09/depth-model)\n\n介绍:对话机器学习大神Michael Jordan\n\n* [《Deep Learning 和 Knowledge Graph 引爆大数据革命》](http://blog.sina.com.cn/s/blog_46d0a3930101fswl.html)\n\n介绍:还有２，３部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html\n\n* [《Deep Learning 教程翻译》](http://blog.sina.com.cn/s/blog_46d0a3930101h6nf.html)\n\n介绍:是Stanford 教授 Andrew Ng 的 Deep Learning 教程，国内的机器学习爱好者很热心的把这个教程翻译成了中文。如果你英语不好，可以看看这个\n\n* [《Deep Learning 101》](http://markus.com/deep-learning-101/)\n\n介绍:因为近两年来，深度学习在媒体界被炒作很厉害（就像大数据）。其实很多人都还不知道什么是深度学习。这篇文章由浅入深。告诉你深度学究竟是什么！\n\n* [《UFLDL Tutorial》](http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial)\n\n介绍:这是斯坦福大学做的一免费课程（很勉强），这个可以给你在深度学习的路上给你一个学习的思路。里面提到了一些基本的算法。而且告诉你如何去应用到实际环境中。[中文版](http://ufldl.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B)\n\n* [《Toronto Deep Learning Demos》](http://deeplearning.cs.toronto.edu/)\n\n介绍:这是多伦多大学做的一个深度学习用来识别图片标签／图转文字的demo。是一个实际应用案例。有源码\n\n* [《Deep learning from the bottom up》](http://metacademy.org/roadmaps/rgrosse/deep_learning)\n\n介绍:机器学习模型，阅读这个内容需要有一定的基础。\n\n* [《R工具包的分类汇总》](http://cran.r-project.org/web/views/)\n\n介绍: (CRAN Task Views, 34种常见任务,每个任务又各自分类列举若干常用相关工具包) 例如: 机器学习，自然语言处理，时间序列分析，空间信息分析，多重变量分析，计量经济学，心理统计学，社会学统计，化学计量学，环境科学，药物代谢动力学 等\n\n* [《机器学习常见算法分类汇总》](http://www.ctocio.com/hotnews/15919.html)\n\n介绍: 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法，以供您在工作和学习中参考.\n\n\n* [《Deep Learning（深度学习）学习笔记整理系列》](http://blog.csdn.net/zouxy09/article/details/8775360)\n\n介绍: 很多干货，而且作者还总结了好几个系列。另外还作者还了一个[文章导航](http://blog.csdn.net/zouxy09/article/details/14222605).非常的感谢作者总结。\n\n[Deep Learning（深度学习）学习笔记整理系列之（二）](http://blog.csdn.net/zouxy09/article/details/8775488)\n\n[Deep Learning（深度学习）学习笔记整理系列之（三）](http://blog.csdn.net/zouxy09/article/details/8775518)\n\n[Deep Learning（深度学习）学习笔记整理系列之（四）](http://blog.csdn.net/zouxy09/article/details/8775524)\n\n[Deep Learning（深度学习）学习笔记整理系列之（五）](http://blog.csdn.net/zouxy09/article/details/8777094)\n\n[Deep Learning（深度学习）学习笔记整理系列之（六）](http://blog.csdn.net/zouxy09/article/details/8781396)\n\n[Deep Learning（深度学习）学习笔记整理系列之（七）](http://blog.csdn.net/zouxy09/article/details/8781543)\n\n[DeepLearning（深度学习）学习笔记整理系列之（八）](http://blog.csdn.net/zouxy09/article/details/8782018)\n\n* [《Tutorials Session A - Deep Learning for Computer Vision》](http://research.microsoft.com/apps/video/default.aspx?id=206976&l=i)\n\n介绍:传送理由：Rob Fergus的用深度学习做计算机是觉的NIPS 2013教程。有mp4, mp3, pdf各种[下载](http://msrvideo.vo.msecnd.net/rmcvideos/206976/dl/206976.pdf) 他是纽约大学教授，目前也在Facebook工作，他2014年的8篇[论文](http://cs.nyu.edu/~fergus/pmwiki/pmwiki.php?n=PmWiki.Publications)\n\n* [《FudanNLP》](https://github.com/xpqiu/fnlp/)\n\n介绍:FudanNLP，这是一个复旦大学计算机学院开发的开源中文自然语言处理（NLP）工具包\nFudan NLP里包含中文分词、关键词抽取、命名实体识别、词性标注、时间词抽取、语法分析等功能，对搜索引擎 文本分析等极为有价值。\n\n* [《Open Sourcing ml-ease》](http://engineering.linkedin.com/large-scale-machine-learning/open-sourcing-ml-ease)\n\n介绍:LinkedIn 开源的机器学习工具包,支持单机, Hadoop cluster，和 Spark cluster 重点是 logistic regression 算法\n\n* [《机器学习周刊》](http://ztl2004.github.io/MachineLearningWeekly/index.html)\n\n介绍:对于英语不好，但又很想学习机器学习的朋友。是一个大的福利。机器学习周刊目前主要提供中文版，还是面向广大国内爱好者，内容涉及机器学习、数据挖掘、并行系统、图像识别、人工智能、机器人等等。谢谢作者\n\n* [《线性代数》](http://v.163.com/special/opencourse/daishu.html)\n\n介绍：《线性代数》是《机器学习》的重要数学先导课程。其实《线代》这门课讲得浅显易懂特别不容易，如果一上来就讲逆序数及罗列行列式性质，很容易让学生失去学习的兴趣。我个人推荐的最佳《线性代数》课程是麻省理工Gilbert Strang教授的课程。 [课程主页](http://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/)\n\n* [《Big-data》](http://blog.andreamostosi.name/big-data/)\n\n介绍:大数据数据处理资源、工具不完备列表，从框架、分布式编程、分布式文件系统、键值数据模型、图数据模型、数据可视化、列存储、机器学习等。很赞的资源汇总。\n\n* [《machine learning for smart dummies》](http://yahoolabs.tumblr.com/post/97839313996/machine-learning-for-smart-dummies)\n\n介绍:雅虎邀请了一名来自本古里安大学的访问学者，制作了一套关于机器学习的系列视频课程。本课程共分为7期，详细讲解了有关SVM, boosting, nearest neighbors, decision trees 等常规机器学习算法的理论基础知识。\n\n* [《Entanglement-Based Quantum Machine Learning》](http://arxiv.org/abs/1409.7770)\n\n介绍:应对大数据时代，量子机器学习的第一个实验 [paper 下载](http://arxiv-web3.library.cornell.edu/pdf/1409.7770.pdf)\n\n* [《How a Math Genius Hacked OkCupid to Find True Love》](http://www.wired.com/2014/01/how-to-hack-okcupid/all/)\n\n介绍:Wired杂志报道了UCLA数学博士Chris McKinlay （图1）通过大数据手段+机器学习方法破解婚恋网站配对算法找到真爱的故事,通过Python脚本控制着12个账号，下载了婚恋网站2万女用户的600万问题答案，对他们进行了统计抽样及聚类分析（图2，3），最后终于收获了真爱。科技改变命运！\n\n* [《Underactuated Robotics》](https://www.edx.org/course/mitx/mitx-6-832x-underactuated-robotics-3511)\n\n介绍:MIT的Underactuated Robotics于 2014年10月1日开课，该课属于MIT研究生级别的课程，对机器人和非线性动力系统感兴趣的朋友不妨可以挑战一下这门课程！\n\n* [《mllib实践经验(1)》](http://www.csdn.net/article/2014-12-26/2823330)\n\n介绍:mllib实践经验分享\n\n* [《Google Turns To Deep Learning Classification To Fight Web Spam》](http://www.seobythesea.com/2014/09/google-turns-deep-learning-classification-fight-web-spam/)\n\n介绍:Google用Deep Learning做的antispam(反垃圾邮件)\n\n* [《NLP常用信息资源》](https://github.com/memect/hao/blob/master/awesome/nlp.md)\n\n介绍:NLP常用信息资源* [《NLP常用信息资源》](https://github.com/memect/hao/blob/master/awesome/nlp.md)\n\n\n* [《机器学习速查表》](https://github.com/soulmachine/machine-learning-cheat-sheet)\n\n介绍:机器学习速查表\n\n* [《Best Papers vs. Top Cited Papers in Computer Science》](http://arnetminer.org/conferencebestpapers)\n\n介绍：从1996年开始在计算机科学的论文中被引用次数最多的论文\n\n* [《InfiniTAM: 基于深度图像的体数据集成框架》](http://mmcheng.net/zh/itam/)\n\n介绍：把今年的一个ACM Trans. on Graphics (TOG)论文中的代码整理为一个开源的算法框架，共享出来了。欢迎大家使用。可以实时的采集3D数据、重建出三维模型。Online learning，GPU Random forest，GPU CRF也会后续公开。\n\n* [《Hacker's guide to Neural Networks》](http://karpathy.github.io/neuralnets/)\n\n介绍：【神经网络黑客指南】现在，最火莫过于深度学习（Deep Learning），怎样更好学习它？可以让你在浏览器中，跑起深度学习效果的超酷开源项目[ConvNetJS](https://github.com/karpathy/convnetjs)作者karpathy告诉你，最佳技巧是，当你开始写代码，一切将变得清晰。他刚发布了一本图书，不断在线更新\n\n* [《Building a Production Machine Learning Infrastructure》](http://machinelearningmastery.com/building-a-production-machine-learning-infrastructure/)\n\n介绍：前Google广告系统工程师Josh Wills 讲述工业界和学术界机器学习的异同,大实话\n\n* [《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》](http://neo4j.com/blog/deep-learning-sentiment-analysis-movie-reviews-using-neo4j/)\n\n介绍：使用[Neo4j](http://www.neo4j.org/) 做电影评论的情感分析。\n\n* [《DeepLearning.University – An Annotated Deep Learning Bibliography》](http://memkite.com/deep-learning-bibliography/)\n\n介绍：不仅是资料，而且还对有些资料做了注释。\n\n* [《A primer on deeping learning》](http://www.datarobot.com/blog/a-primer-on-deep-learning/)\n\n介绍：深度学习入门的初级读本\n\n* [《Machine learning is teaching us the secret to teaching 》](https://news.ycombinator.com/item?id=8379571)\n\n介绍：机器学习教会了我们什么？\n\n* [《scikit-learn：用于机器学习的Python模块》](http://scikit-learn.org/stable/documentation.html)\n\n介绍：scikit-learn是在SciPy基础上构建的用于机器学习的Python模块。\n\n\n* [《对话机器学习大神Michael Jordan：解析领域中各类模型》](http://www.infoq.com/cn/news/2014/10/interview-michael-jordan)\n\n介绍：乔丹教授（Michael I. Jordan）教授是机器学习领域神经网络的大牛，他对深度学习、神经网络有着很浓厚的兴趣。因此，很多提问的问题中包含了机器学习领域的各类模型，乔丹教授对此一一做了解释和展望。\n\n* [《A*搜索算法的可视化短教程》](http://www.redblobgames.com/pathfinding/a-star/introduction.html)\n\n介绍：A*搜索是人工智能基本算法，用于高效地搜索图中两点的最佳路径, 核心是 g(n)+h(n): g(n)是从起点到顶点n的实际代价，h(n)是顶点n到目标顶点的估算代价。[合集](https://github.com/memect/hao/issues/256)\n\n* [《基于云的自然语言处理开源项目FudanNLP》](http://code.csdn.net/news/2822123)\n\n介绍：本项目利用了Microsoft Azure，可以在几分种内完成NLP on Azure Website的部署，立即开始对FNLP各种特性的试用，或者以REST API的形式调用FNLP的语言分析功能\n\n* [《吴立德《概率主题模型&数据科学基础》](http://www.youku.com/playlist_show/id_22935176.html)\n\n介绍：现任复旦大学首席教授、计算机软件博士生导师。计算机科学研究所副所长.内部课程\n\n* [《机器学习入门资源不完全汇总》](http://ml.memect.com/article/machine-learning-guide.html)\n\n介绍：好东西的干货真的很多\n\n* [《收集从2014年开始深度学习文献》](http://memkite.com/deep-learning-bibliography/)\n\n介绍：从硬件、图像到健康、生物、大数据、生物信息再到量子计算等，Amund Tveit等维护了一个DeepLearning.University小项目：收集从2014年开始深度学习文献，相信可以作为深度学习的起点,[github](https://github.com/memkite/DeepLearningBibliography)\n\n* [《EMNLP上两篇关于股票趋势的应用论文 》](http://emnlp2014.org/papers/pdf/EMNLP2014148.pdf)\n\n介绍：EMNLP上两篇关于[stock trend](http://emnlp2014.org/papers/pdf/EMNLP2014148.pdf) 用到了deep model组织特征；[ Exploiting Social Relations and Sentiment for Stock Prediction](http://emnlp2014.org/papers/pdf/EMNLP2014120.pdf)用到了stock network。\n\n* [《Bengio组（蒙特利尔大学LISA组）深度学习教程 》](http://deeplearning.net/tutorial/deeplearning.pdf)\n\n介绍：作者是深度学习一线大牛Bengio组写的教程，算法深入显出，还有实现代码，一步步展开。\n\n* [《学习算法的Neural Turing Machine 》](http://arxiv.org/pdf/1410.5401v1.pdf)\n\n介绍：许多传统的机器学习任务都是在学习function，不过谷歌目前有开始学习算法的趋势。谷歌另外的这篇学习Python程序的[Learning to Execute](http://arxiv.org/pdf/1410.4615v1.pdf)也有相似之处\n\n* [《Learning to Rank for Information Retrieval and Natural Language Processing》](http://www.morganclaypool.com/doi/abs/10.2200/S00607ED2V01Y201410HLT026)\n\n介绍：作者是华为技术有限公司，诺亚方舟实验室，首席科学家的李航博士写的关于信息检索与自然语言处理的文章\n\n* [《Rumor has it: Identifying Misinformation in Microblogs》](http://www.aclweb.org/anthology/D11-1147)\n\n介绍：利用机用器学习在谣言的判别上的应用,此外还有两个。一个是识别垃圾与虚假信息的[paper](http://digital.cs.usu.edu/~kyumin/tutorial/www-tutorial.pdf).还有一个是[网络舆情及其分析技术](http://www.datatang.com/news/details_1319.htm)\n\n* [《R机器学习实践》](http://study.163.com/course/introduction/854064.htm)\n\n介绍：该课程是网易公开课的收费课程，不贵，超级便宜。主要适合于对利用R语言进行机器学习，数据挖掘感兴趣的人。\n\n* [《大数据分析：机器学习算法实现的演化》](http://ifeve.com/bigdataanalyticsbeyondhadoop_evolutionofmlrealizaton/)\n\n介绍：本章中作者总结了三代机器学习算法实现的演化：第一代非分布式的， 第二代工具如Mahout和Rapidminer实现基于Hadoop的扩展，第三代如Spark和Storm实现了实时和迭代数据处理。[BIG DATA ANALYTICS BEYOND HADOOP](http://ifeve.com/wp-content/uploads/2014/05/big-data-analytics-beyond-hadoop.pdf)\n\n* [《图像处理，分析与机器视觉》](http://book.douban.com/subject/5921462/)\n\n介绍：讲计算机视觉的四部奇书（应该叫经典吧）之一，另外三本是Hartley的《多图几何》、Gonzalez的《数字图像处理》、Rafael C.Gonzalez / Richard E.Woods 的[《数字图像处理》](http://book.douban.com/subject/1106342/)\n\n* [《LinkedIn最新的推荐系统文章Browsemaps》](http://pan.baidu.com/s/1sjFeLTN)\n\n介绍：里面基本没涉及到具体算法，但作者介绍了CF在LinkedIn的很多应用，以及他们在做推荐过程中获得的一些经验。最后一条经验是应该监控log数据的质量，因为推荐的质量很依赖数据的质量！\n\n* [《初学者如何查阅自然语言处理（NLP）领域学术资料》](http://blog.sina.com.cn/s/blog_574a437f01019poo.html)\n\n介绍：初学者如何查阅自然语言处理（NLP）领域学术资料\n\n* [《树莓派的人脸识别教程》](http://www.open-electronics.org/raspberry-pi-and-the-camera-pi-module-face-recognition-tutorial/)\n\n介绍：用树莓派和相机模块进行人脸识别\n\n* [《利用深度学习与大数据构建对话系统  》](http://www.hangli-hl.com/uploads/3/1/6/8/3168008/short_text_conversation_mla.pdf)\n\n介绍：如何利用深度学习与大数据构建对话系统 \n\n* [《经典论文Leo Breiman：Statistical Modeling: The Two Cultures  》](http://lear.inrialpes.fr/people/mairal/resources/pdf/review_sparse_arxiv.pdf)\n\n介绍：Francis Bach合作的有关稀疏建模的新综述(书)：Sparse Modeling for Image and Vision Processing，内容涉及Sparsity, Dictionary Learning, PCA, Matrix Factorization等理论，以及在图像和视觉上的应用，而且第一部分关于Why does the l1-norm induce sparsity的解释也很不错。\n\n* [《Reproducing Kernel Hilbert Space》](http://www.umiacs.umd.edu/~hal/docs/daume04rkhs.pdf)\n\n介绍：RKHS是机器学习中重要的概念，其在large margin分类器上的应用也是广为熟知的。如果没有较好的数学基础，直接理解RKHS可能会不易。本文从基本运算空间讲到Banach和Hilbert空间，深入浅出，一共才12页。\n\n* [《Hacker's guide to Neural Networks》](http://karpathy.github.io/neuralnets/)\n\n介绍：许多同学对于机器学习及深度学习的困惑在于，数学方面已经大致理解了，但是动起手来却不知道如何下手写代码。斯坦福深度学习博士Andrej Karpathy写了一篇实战版本的深度学习及机器学习教程，手把手教你用Javascript写神经网络和SVM.\n\n* [《【语料库】语料库资源汇总》](http://blog.csdn.net/pandalibaba/article/details/17409395)\n\n介绍：【语料库】语料库资源汇总\n\n* [《机器学习算法之旅》](http://blog.jobbole.com/60809/)\n\n介绍：本文会过一遍最流行的机器学习算法，大致了解哪些方法可用，很有帮助。\n\n* [《Reproducible Research in Computational Science》](http://www.csee.wvu.edu/~xinl/source.html)\n\n介绍：这个里面有很多关于机器学习、信号处理、计算机视觉、深入学习、神经网络等领域的大量源代码（或可执行代码）及相关论文。科研写论文的好资源\n\n* [《NYU 2014年的深度学习课程资料》](http://cilvr.nyu.edu/doku.php?id=deeplearning:slides:start)\n\n介绍：NYU 2014年的深度学习课程资料，有视频\n\n* [《计算机视觉数据集不完全汇总》](https://github.com/memect/hao/blob/master/awesome/computer-vision-dataset.md)\n\n介绍：计算机视觉数据集不完全汇总\n\n* [《Machine Learning Open Source Software》](http://mloss.org/software/)\n\n介绍：机器学习开源软件\n\n* [《LIBSVM》](http://www.csie.ntu.edu.tw/~cjlin/libsvm/)\n\n介绍：A Library for Support Vector Machines\n\n* [《Support Vector Machines》](http://www.support-vector-machines.org/index.html)\n\n介绍：[数据挖掘十大经典算法](files.cnblogs.com/tekson/数据挖掘之经典算法.doc)之一\n\n* [《100 Best GitHub: Deep Learning》](http://meta-guide.com/software-meta-guide/100-best-github-deep-learning/)\n\n介绍：github上面100个非常棒的项目\n\n* [《加州大学欧文分校(UCI)机器学习数据集仓库》](http://archive.ics.uci.edu/ml)\n\n介绍：当前加州大学欧文分校为机器学习社区维护着306个数据集。[查询数据集](http://archive.ics.uci.edu/ml/datasets.html)\n\n* [《Andrej Karpathy个人主页》](http://cs.stanford.edu/people/karpathy/)\n\n介绍：Andrej Karpathy 是斯坦福大学Li Fei-Fei的博士生，使用机器学习在图像、视频语义分析领域取得了科研和工程上的突破，发的文章不多，但每个都很扎实，在每一个问题上都做到了state-of-art.\n\n* [《Andrej Karpathy的深度强化学习演示》](http://cs.stanford.edu/people/karpathy/convnetjs/demo/rldemo.html)\n\n介绍：Andrej Karpathy的深度强化学习演示，[论文在这里](http://arxiv.org/pdf/1312.5602v1.pdf)\n\n* [《CIKM数据挖掘竞赛夺冠算法-陈运文》](http://www.52nlp.cn/cikm-competition-topdata)\n\n介绍：CIKM Cup(或者称为CIKM Competition)是ACM CIKM举办的国际数据挖掘竞赛的名称。\n\n* [《Geoffrey E. Hinton》](http://www.cs.toronto.edu/~hinton/)\n\n介绍：杰弗里·埃弗里斯特·辛顿 FRS是一位英国出生的计算机学家和心理学家，以其在神经网络方面的贡献闻名。辛顿是反向传播算法和对比散度算法的发明人之一，也是深度学习的积极推动者.\n\n* [《自然语言处理的深度学习理论与实际》](http://cikm2014.fudan.edu.cn/cikm2014/Tpl/Public/slides/CIKM14_tutorial_slides_6.pdf)\n\n介绍：微软研究院深度学习技术中心在CIKM2014 上关于《自然语言处理的深度学习理论与实际》教学讲座的幻灯片\n\n* [《用大数据和机器学习做股票价格预测》](http://eugenezhulenev.com/blog/2014/11/14/stock-price-prediction-with-big-data-and-machine-learning/)\n\n介绍： 本文基于<支持向量机的高频限价订单的动态建模>采用了 Apache Spark和Spark MLLib从纽约股票交易所的订单日志数据构建价格运动预测模型。(股票有风险，投资谨慎)GitHub源代码托管[地址](https://github.com/ezhulenev/orderbook-dynamics).\n\n* [《关于机器学习的若干理论问题》](http://dataunion.org/?p=2011)\n\n介绍：徐宗本 院士将于热爱机器学习的小伙伴一起探讨有关于机器学习的几个理论性问题，并给出一些有意义的结论。最后通过一些实例来说明这些理论问题的物理意义和实际应用价值。\n\n* [《深度学习在自然语言处理的应用》](http://vdisk.weibo.com/s/D2szyg_bBVM0)\n\n介绍：作者还著有《这就是搜索引擎：核心技术详解》一书，主要是介绍应用层的东西\n\n* [《Undergraduate machine learning at UBC》](http://www.cs.ubc.ca/~nando/340-2012/index.php)\n\n介绍：机器学习课程\n\n* [《人脸识别必读的N篇文章》](http://blog.sina.com.cn/s/blog_6ae183910101h4jr.html)\n\n介绍：人脸识别必读文章推荐\n\n* [《推荐系统经典论文文献及业界应用》](http://semocean.com/%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F%E7%BB%8F%E5%85%B8%E8%AE%BA%E6%96%87%E6%96%87%E7%8C%AE%E5%8F%8A%E8%B5%84%E6%96%99/)\n\n介绍：推荐系统经典论文文献\n\n* [《人脸识别必读的N篇文章》](http://blog.sina.com.cn/s/blog_6ae183910101h4jr.html)\n\n介绍：人脸识别必读文章推荐\n\n* [《第十二届中国\"机器学习及其应用\"研讨会PPT》](http://see.xidian.edu.cn/vipsl/MLA2014/program.htm)\n\n介绍：第十二届中国\"机器学习及其应用\"研讨会PPT\n\n* [《统计机器学习》](http://ocw.sjtu.edu.cn/G2S/OCW/cn/CourseDetails.htm?Id=398)\n\n介绍：统计学习是关于计算机基于数据构建的概率统计模型并运用模型对数据进行预测和分析的一门科学，统计学习也成为统计机器学习。课程来自上海交通大学\n\n* [《机器学习导论》](http://ocw.sjtu.edu.cn/G2S/OCW/cn/CourseDetails.htm?Id=397)\n\n介绍：机器学习的目标是对计算机编程，以便使用样本数据或以往的经验来解决给定的问题.\n\n* [《CIKM 2014主题报告的幻灯片》](http://cikm2014.fudan.edu.cn/)\n\n介绍：CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum的主题报告的幻灯片， Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin的Industry Track报告的幻灯片\n\n* [《人工智能和机器学习领域有趣的开源项目》](http://deeplearning.net/software_links/)\n\n介绍：部分中文[列表](http://code.csdn.net/news/2822818)\n\n* [《机器学习经典算法详解及Python实现--基于SMO的SVM分类器》](http://blog.csdn.net/suipingsp/article/details/41645779)\n\n介绍:此外作者还有一篇[元算法、AdaBoost　python实现文章](http://blog.csdn.net/suipingsp/article/details/41722435)\n\n* [《Numerical Optimization: Understanding L-BFGS》](http://aria42.com/blog/2014/12/understanding-lbfgs/)\n\n介绍:加州伯克利大学博士Aria Haghighi写了一篇超赞的数值优化博文，从牛顿法讲到拟牛顿法，再讲到BFGS以及L-BFGS, 图文并茂，还有伪代码。强烈推荐。\n\n* [《简明深度学习方法概述（一）》](http://www.goldencui.org/2014/12/02/%E7%AE%80%E6%98%8E%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%96%B9%E6%B3%95%E6%A6%82%E8%BF%B0%EF%BC%88%E4%B8%80%EF%BC%89/)\n\n介绍:还有续集[简明深度学习方法概述（二）](http://www.goldencui.org/2014/12/06/%E7%AE%80%E6%98%8E%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%96%B9%E6%B3%95%E6%A6%82%E8%BF%B0%EF%BC%88%E4%BA%8C%EF%BC%89/)\n\n* [《R language for programmers》](http://www.johndcook.com/blog/r_language_for_programmers/)\n\n介绍:Ｒ语言程序员私人定制版\n\n* [《谷歌地图解密：大数据与机器学习的结合》](http://www.cheyun.com/content/news/4051)\n\n介绍:谷歌地图解密\n\n* [《空间数据挖掘常用方法》](http://blog.csdn.net/u012690204/article/details/41853731)\n\n介绍:空间数据挖掘常用方法\n\n* [《Use Google's Word2Vec for movie reviews》](https://www.kaggle.com/c/word2vec-nlp-tutorial)\n\n介绍:Kaggle新比赛 ”When bag of words meets bags of popcorn“ aka ”边学边用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型，并在实际比赛里面比调参数和清数据。 如果已装过gensim不要忘升级\n\n* [《PyNLPIR》](http://pynlpir.readthedocs.org/en/latest/)\n\n介绍:PyNLPIR提供了NLPIR/ICTCLAS汉语分词的Python接口,此外[Zhon](http://zhon.readthedocs.org/en/latest/)提供了常用汉字常量，如CJK字符和偏旁，中文标点，拼音，和汉字正则表达式（如找到文本中的繁体字）\n\n* [《深度卷积神经网络下围棋》](http://www.technologyreview.com/view/533496/why-neural-networks-look-set-to-thrash-the-best-human-go-players-for-the-first-time/)\n\n介绍:这文章说把最近模型识别上的突破应用到围棋软件上，打16万张职业棋谱训练模型识别功能。想法不错。训练后目前能做到不用计算，只看棋盘就给出下一步，大约10级棋力。但这篇文章太过乐观，说什么人类的最后一块堡垒马上就要跨掉了。话说得太早。不过，如果与别的软件结合应该还有潜力可挖。@万精油墨绿\n\n* [《NIPS审稿实验》](http://mrtz.org/blog/the-nips-experiment/)\n\n介绍:UT Austin教授Eric Price关于今年NIPS审稿实验的详细分析,他表示，根据这次实验的结果，如果今年NIPS重新审稿的话，会有一半的论文被拒。\n\n* [《2014年最佳的大数据，数据科学文章》](http://www.kdnuggets.com/2014/12/top-kdnuggets-2014-analytics-big-data-science-stories.html)\n\n介绍:KDNuggets分别总结了2014年14个阅读最多以及分享最多的文章。我们从中可以看到多个主题——深度学习，数据科学家职业，教育和薪酬，学习数据科学的工具比如R和Python以及大众投票的最受欢迎的数据科学和数据挖掘语言\n\n* [《机器学习经典算法详解及Python实现--线性回归（Linear Regression）算法》](http://blog.csdn.net/suipingsp/article/details/42101139)\n\n介绍:Python实现线性回归,作者还有其他很棒的文章推荐可以看看\n\n* [《2014中国大数据技术大会33位核心专家演讲PDF》](http://download.csdn.net/album/detail/1367/1/1)\n\n介绍：2014中国大数据技术大会33位核心专家演讲PDF下载\n\n* [《使用RNN和Paragraph Vector做情感分析》](http://arxiv.org/abs/1412.5335)\n\n介绍：这是T. Mikolov & Y. Bengio最新论文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ，使用RNN和PV在情感分析效果不错，［项目代码］(https://github.com/mesnilgr/iclr15)公布在github(目前是空的)。这意味着Paragraph Vector终于揭开面纱了嘛。\n\n* [《NLPIR/ICTCLAS2015分词系统大会上的技术演讲 》](http://pan.baidu.com/s/1o6I9S18)\n\n介绍:NLPIR/ICTCLAS2015分词系统发布与用户交流大会上的演讲，请更多朋友检阅新版分词吧。  我们实验室同学的演讲包括：[孙梦姝-基于评论观点挖掘的商品搜索技术研究](http://pan.baidu.com/s/1hqotVVm) [李然-主题模型](http://pan.baidu.com/s/1pJ9KuZh)\n\n* [《Machine Learning is Fun!》](https://medium.com/code-poet/80ea3ec3c471)\n\n介绍:Convex Neural Networks 解决维数灾难 \n\n* [《CNN的反向求导及练习》](http://dataunion.org/?p=5395)\n\n介绍:介绍CNN参数在使用bp算法时该怎么训练，毕竟CNN中有卷积层和下采样层，虽然和MLP的bp算法本质上相同，但形式上还是有些区别的，很显然在完成CNN反向传播前了解bp算法是必须的。此外作者也做了一个[资源集:机器学习，深度学习，视觉，数学等](http://www.cnblogs.com/tornadomeet/archive/2012/05/24/2515980.html)\n\n* [《正则表达式优化成Trie树 》](https://github.com/cloudflare/ahocorasick)\n\n介绍:如果要在一篇文章中匹配十万个关键词怎么办？[Aho-Corasick](https://github.com/cloudflare/ahocorasick) 算法利用添加了返回边的Trie树，能够在线性时间内完成匹配。 但如果匹配十万个正则表达式呢 ？ 这时候可以用到把多个正则优化成Trie树的方法，如日本人写的 [Regexp::Trie](http://search.cpan.org/~dankogai/Regexp-Trie-0.02/)\n\n* [《Deep learning Reading List》](http://jmozah.github.io/links/)\n\n介绍:深度学习阅读清单\n\n* [《Caffe》](http://caffe.berkeleyvision.org/)\n\n介绍:Caffe是一个开源的深度学习框架，作者目前在google工作，作者主页[Yangqing Jia (贾扬清)](http://daggerfs.com/index.html)\n\n* [《GoogLeNet深度学习模型的Caffe复现 》](https://github.com/BVLC/caffe/blob/master/models/bvlc_googlenet/readme.md)\n\n介绍:2014 ImageNet冠军GoogLeNet深度学习模型的Caffe复现模型,[GoogleNet论文](http://arxiv.org/abs/1409.4842).\n\n* [《LambdaNet，Haskell实现的开源人工神经网络库 》](https://github.com/jbarrow/LambdaNet)\n\n介绍:LambdaNetLambdaNet是由Haskell实现的一个开源的人工神经网络库，它抽象了网络创建、训练并使用了高阶函数。该库还提供了一组预定义函数，用户可以采取多种方式组合这些函数来操作现实世界数据。\n\n* [《百度余凯&张潼机器学习视频》](http://wenku.baidu.com/course/view/49e8b8f67c1cfad6195fa705)\n\n介绍:如果你从事互联网搜索，在线广告，用户行为分析，图像识别，自然语言理解，或者生物信息学，智能机器人，金融预测，那么这门核心课程你必须深入了解。\n\n* [《杨强在TEDxNanjing谈智能的起源》](http://v.youku.com/v_show/id_XODQzNDM4MDg0.html)\n\n介绍:\"人工智能研究分许多流派。其中之一以IBM为代表，认为只要有高性能计算就可得到智能，他们的‘深蓝’击败了世界象棋冠军；另一流派认为智能来自动物本能；还有个很强的流派认为只要找来专家，把他们的思维用逻辑一条条写下，放到计算机里就行……\" 杨强在TEDxNanjing谈智能的起源\n\n* [《深度RNN/LSTM用于结构化学习 0)序列标注Connectionist Temporal ClassificationICML06》](http://www.machinelearning.org/proceedings/icml2006/047_Connectionist_Tempor.pdf)\n\n介绍:1)机器翻译[Sequence to Sequence NIPS14](http://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf) 2)成分句法[GRAMMAR AS FOREIGN LANGUAGE](http://arxiv.org/pdf/1412.7449v1.pdf)\n\n* [《Deep Learning实战之word2vec》](http://techblog.youdao.com/?p=915)\n\n介绍:网易有道的三位工程师写的word2vec的解析文档，从基本的词向量/统计语言模型->NNLM->Log-Linear/Log-Bilinear->层次化Log-Bilinear，到CBOW和Skip-gram模型，再到word2vec的各种tricks，公式推导与代码，基本上是网上关于word2vec资料的大合集，对word2vec感兴趣的朋友可以看看\n\n* [《Machine learning open source software》](http://mloss.org/software/)\n\n介绍:机器学习开源软件,收录了各种机器学习的各种编程语言学术与商业的开源软件．与此类似的还有很多例如:[DMOZ - Computers: Artificial Intelligence: Machine Learning: Software](http://www.dmoz.org/Computers/Artificial_Intelligence/Machine_Learning/Software/),　[LIBSVM -- A Library for Support Vector Machines](http://www.csie.ntu.edu.tw/~cjlin/libsvm/),　[Weka 3: Data Mining Software in Java](http://www.cs.waikato.ac.nz/ml/weka/),　[scikit-learn:Machine Learning in Python](http://scikit-learn.org/stable/),　[Natural Language Toolkit:NLTK](www.nltk.org),　[MAchine Learning for LanguagE Toolkit](http://mallet.cs.umass.edu/),　[Data Mining - Fruitful and Fun](http://orange.biolab.si/),　[Open Source Computer Vision Library](http://opencv.willowgarage.com/wiki/)\n\n* [《机器学习入门者学习指南》](http://www.guokr.com/post/512037/)\n\n介绍:作者是计算机研二(写文章的时候，现在是2015年了应该快要毕业了)，专业方向自然语言处理．这是一点他的经验之谈．对于入门的朋友或许会有帮助\n\n* [《A Tour of Machine Learning Algorithms》](http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/)\n\n介绍:这是一篇关于机器学习算法分类的文章，非常好\n\n* [《2014年的《机器学习日报》大合集》](http://ml.memect.com/download/2014.zip)\n\n介绍:机器学习日报里面推荐很多内容，在这里有一部分的优秀内容就是来自机器学习日报．\n\n* [《 Image classification with deep learning常用模型》](http://blog.csdn.net/abcjennifer/article/details/42493493)\n\n介绍:这是一篇关于图像分类在深度学习中的文章\n\n* [《自动语音识别：深度学习方法》](http://research.microsoft.com/en-us/people/deng/)\n\n介绍:作者与Bengio的兄弟Samy 09年合编《自动语音识别：核方法》 3）李开复1989年《自动语音识别》专著，其博导、94年图灵奖得主Raj Reddy作序\n\n* [《NLP中的中文分词技术》](http://blog.csdn.net/heiyeshuwu/article/details/42554903)\n\n介绍: 作者是360电商技术组成员,这是一篇NLP在中文分词中的应用\n\n* [《Using convolutional neural nets to detect facial keypoints tutorial》](http://danielnouri.org/notes/2014/12/17/using-convolutional-neural-nets-to-detect-facial-keypoints-tutorial/)\n\n介绍: 使用deep learning的人脸关键点检测，此外还有一篇[AWS部署教程](https://www.kaggle.com/c/facial-keypoints-detection/details/deep-learning-tutorial)\n\n* [《书籍推荐:Advanced Structured Prediction》](http://www.amazon.cn/Advanced-Structured-Prediction-Nowozin-Sebastian/dp/0262028379)\n\n介绍: 由Sebastian Nowozin等人编纂MIT出版的新书《Advanced Structured Prediction》http://t.cn/RZxipKG ，汇集了结构化预测领域诸多牛文，涉及CV、NLP等领域，值得一读。网上公开的几章草稿:[一](http://www2.informatik.hu-berlin.de/~kloftmar/publications/strucBook.pdf),[二](http://mlg.eng.cam.ac.uk/yutian/Publications/ChenGelfandWelling14-HerdingBookChapter.pdf),[三](http://web.engr.oregonstate.edu/~sinisa/research/publications/StructPredictionChapter14.pdf),[四](http://ttic.uchicago.edu/~meshi/papers/smoothCD_chapter.pdf),[五](http://www.cs.ox.ac.uk/Stanislav.Zivny/homepage/publications/zwp14mit-draft.pdf)\n\n* [《An Introduction to Matrix Concentration Inequalities》](http://arxiv.org/pdf/1501.01571v1.pdf)\n\n介绍: Tropp把数学家用高深装逼的数学语言写的矩阵概率不等式用初等的方法写出来，是非常好的手册，领域内的paper各种证明都在用里面的结果。虽说是初等的，但还是非常的难\n\n* [《The free big data sources you should know》](https://agenda.weforum.org/2014/12/the-free-big-data-sources-you-should-know/)\n\n介绍: 不容错过的免费大数据集，有些已经是耳熟能详，有些可能还是第一次听说，内容跨越文本、数据、多媒体等，让他们伴你开始数据科学之旅吧，具体包括：Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk等\n\n* [《A Brief Overview of Deep Learning》](http://yyue.blogspot.com/2015/01/a-brief-overview-of-deep-learning.html)\n\n介绍: 谷歌科学家、Hinton亲传弟子Ilya Sutskever的深度学习综述及实际建议\n\n* [《A Deep Dive into Recurrent Neural Nets》](http://nikhilbuduma.com/2015/01/11/a-deep-dive-into-recurrent-neural-networks/)\n\n介绍: 非常好的讨论递归神经网络的文章，覆盖了RNN的概念、原理、训练及优化等各个方面内容，强烈推荐！本文作者Nikhil Buduma还有一篇[Deep Learning in a Nutshell](http://nikhilbuduma.com/2014/12/29/deep-learning-in-a-nutshell/)值得推荐\n\n* [《机器学习：学习资源》](http://qianjiye.de/2014/11/machine-learning-resources/)\n\n介绍:里面融合了很多的资源，例如竞赛，在线课程，demo，数据整合等。有分类\n\n* [《Statistical foundations of machine learning》](https://www.otexts.org/book/sfml)\n\n介绍:《机器学习的统计基础》在线版，该手册希望在理论与实践之间找到平衡点，各主要内容都伴有实际例子及数据，书中的例子程序都是用R语言编写的。\n\n* [《A Deep Learning Tutorial: From Perceptrons to Deep Networks》](http://www.toptal.com/machine-learning/an-introduction-to-deep-learning-from-perceptrons-to-deep-networks)\n\n介绍:IVAN VASILEV写的深度学习导引：从浅层感知机到深度网络。高可读\n\n* [《Research priorities for robust and beneficial artificial intelligence》](http://futureoflife.org/static/data/documents/research_priorities.pdf)\n\n介绍:鲁棒及有益的人工智能优先研究计划：一封公开信,目前已经有Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk等人签署[The Future of Life Institute (FLI)](http://futureoflife.org/misc/open_letter).这封信的背景是最近霍金和Elon Musk提醒人们注意AI的潜在威胁。公开信的内容是AI科学家们站在造福社会的角度，展望人工智能的未来发展方向，提出开发AI系统的Verification，Validity, Security, Control四点要求，以及需要注意的社会问题。毕竟当前AI在经济领域，法律，以及道德领域相关研究较少。其实还有一部美剧[《疑犯追踪》](http://tv.sohu.com/20120925/n353925789.shtml),介绍了AI的演进从一开始的自我学习，过滤，图像识别，语音识别等判断危险，到第四季的时候出现了机器通过学习成长之后想控制世界的状态。说到这里推荐收看。\n\n* [《metacademy》](http://metacademy.org/)\n\n介绍:里面根据词条提供了许多资源，还有相关知识结构，路线图，用时长短等。号称是”机器学习“搜索引擎\n\n* [《FAIR open sources deep-learning modules for Torch》](https://research.facebook.com/blog/879898285375829/fair-open-sources-deep-learning-modules-for-torch/)\n\n介绍:Facebook人工智能研究院（FAIR）开源了一系列软件库，以帮助开发者建立更大、更快的深度学习模型。开放的软件库在 Facebook 被称作模块。用它们替代机器学习领域常用的开发环境 Torch 中的默认模块，可以在更短的时间内训练更大规模的神经网络模型。\n\n* [《浅析人脸检测之Haar分类器方法》](http://www.cnblogs.com/ello/archive/2012/04/28/2475419.html)\n\n介绍:本文虽然是写于2012年，但是这篇文章完全是作者的经验之作。\n\n* [《如何成为一位数据科学家》](http://www.ituring.com.cn/article/55994)\n\n介绍:本文是对《机器学习实战》作者Peter Harrington做的一个访谈。包含了书中部分的疑问解答和一点个人学习建议\n\n* [《Deep learning from the bottom up》](http://www.metacademy.org/roadmaps/rgrosse/deep_learning)\n\n介绍:非常好的深度学习概述，对几种流行的深度学习模型都进行了介绍和讨论\n\n* [《Hands-On Data Science with R Text Mining》](http://onepager.togaware.com/TextMiningO.pdf)\n\n介绍:主要是讲述了利用R语言进行数据挖掘\n\n* [《Understanding Convolutions》](http://colah.github.io/posts/2014-07-Understanding-Convolutions/)\n\n介绍:帮你理解卷积神经网络，讲解很清晰，此外还有两篇[Conv Nets: A Modular Perspective](http://colah.github.io/posts/2014-07-Conv-Nets-Modular/)，[Groups & Group Convolutions](http://colah.github.io/posts/2014-12-Groups-Convolution/). 作者的其他的关于神经网络文章也很棒\n\n* [《Introduction to Deep Learning Algorithms》](http://www.iro.umontreal.ca/~pift6266/H10/notes/deepintro.html#introduction-to-deep-learning-algorithms)\n\n介绍:Deep Learning算法介绍，里面介绍了06年3篇让deep learning崛起的论文\n\n* [《Learning Deep Architectures for AI》](http://www.iro.umontreal.ca/~bengioy/papers/ftml_book.pdf)\n\n介绍:一本学习人工智能的书籍，作者是Yoshua Bengio，相关[国内报道](http://www.infoq.com/cn/articles/ask-yoshua-bengio)\n\n* [《Geoffrey E. Hinton个人主页》](http://www.cs.toronto.edu/~hinton/)\n\n介绍:Geoffrey Hinton是Deep Learning的大牛，他的主页放了一些介绍性文章和课件值得学习\n\n* [《PROBABILITY THEORY: THE LOGIC OF SCIENCE》](http://omega.albany.edu:8008/JaynesBook.html)\n\n介绍:概率论：数理逻辑书籍\n\n* [《H2O》](https://github.com/h2oai/h2o)\n\n介绍:一个用来快速的统计，机器学习并且对于数据量大的数学库\n\n* [《ICLR 2015会议的arXiv稿件合集》](http://www.iclr.cc/doku.php?id=iclr2015:main)\n\n介绍:在这里你可以看到最近深度学习有什么新动向。\n\n* [《Introduction to Information Retrieval》](http://www-nlp.stanford.edu/IR-book/)\n\n介绍:此书在信息检索领域家喻户晓， 除提供该书的免费电子版外，还提供一个[IR资源列表](http://www-nlp.stanford.edu/IR-book/information-retrieval.html) ，收录了信息检索、网络信息检索、搜索引擎实现等方面相关的图书、研究中心、相关课程、子领域、会议、期刊等等，堪称全集，值得收藏\n\n* [《Information Geometry and its Applications to Machine Learning》](http://yosinski.com/mlss12/MLSS-2012-Amari-Information-Geometry/)\n\n介绍:信息几何学及其在机器学习中的应用\n\n* [《Legal Analytics – Introduction to the Course》](http://computationallegalstudies.com/2015/01/legal-analytics-introduction-course-professors-daniel-martin-katz-michael-j-bommarito/)\n\n介绍:课程《法律分析》介绍幻灯片。用机器学习解决法律相关分析和预测问题，相关的法律应用包括预测编码、早期案例评估、案件整体情况的预测，定价和工作人员预测，司法行为预测等。法律领域大家可能都比较陌生，不妨了解下。\n\n* [《文本上的算法》](https://github.com/yanxionglu/text_pdf)\n\n介绍: 文中提到了最优，模型，最大熵等等理论，此外还有应用篇。推荐系统可以说是一本不错的阅读稿，关于模型还推荐一篇[Generative Model 与 Discriminative Model](http://blog.sina.com.cn/s/blog_6742eecd0100iqcv.html)\n\n* [《NeuralTalk》](https://github.com/karpathy/neuraltalk)\n\n介绍: NeuralTalk is a Python+numpy project for learning Multimodal Recurrent Neural Networks that describe images with sentences.NeuralTalk是一个Python的从图像生成自然语言描述的工具。它实现了Google (Vinyals等，卷积神经网络CNN + 长短期记忆LSTM) 和斯坦福 (Karpathy and Fei-Fei， CNN + 递归神经网络RNN)的算法。NeuralTalk自带了一个训练好的动物模型，你可以拿狮子大象的照片来试试看\n\n* [《Deep Learning on Hadoop 2.0》](https://www.paypal-engineering.com/2015/01/12/deep-learning-on-hadoop-2-0-2/)\n\n介绍:本文主要介绍了在Hadoop2.0上使用深度学习,文章来自paypal\n\n* [《Practical recommendations for gradient-based training of deep architectures》](http://arxiv.org/abs/1206.5533)\n\n介绍:用基于梯度下降的方法训练深度框架的实践推荐指导,作者是[Yoshua Bengio](http://www.iro.umontreal.ca/~bengioy/yoshua_en/research.html) .感谢@xuewei4d 推荐\n\n* [《Machine Learning With Statistical And Causal Methods》](http://machinelearningmastery.com/machine-learning-statistical-causal-methods/)\n\n介绍: 用统计和因果方法做机器学习（视频报告）\n\n* [《Machine Learning Course 180’》](https://www.youtube.com/playlist?list=PLD0F06AA0D2E8FFBA)\n\n介绍: 一个讲机器学习的Youtube视频教程。160集。系统程度跟书可比拟。\n\n* [《回归(regression)、梯度下降(gradient descent)》](http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in_machine_learning_1_regression_and_gradient_descent.html)\n\n介绍: 机器学习中的数学，作者的研究方向是机器学习，并行计算如果你还想了解一点其他的可以看看他[博客](http://www.cnblogs.com/LeftNotEasy/archive/2011/05/02/recommended-blogspots.html)的其他文章\n\n* [《美团推荐算法实践》](http://tech.meituan.com/mt-recommend-practice.html)\n\n介绍: 美团推荐算法实践，从框架，应用，策略，查询等分析\n\n* [《Deep Learning for Answer Sentence Selection》](http://arxiv.org/abs/1412.1632)\n\n介绍: 深度学习用于问答系统答案句的选取 \n\n* [《Learning Semantic Representations Using Convolutional Neural Networks for Web Search 》](http://www.iro.umontreal.ca/~lisa/pointeurs/WWW2014.pdf)\n\n介绍: CNN用于WEB搜索，深度学习在文本计算中的应用\n\n* [《Awesome Public Datasets》](https://github.com/caesar0301/awesome-public-datasets)\n\n介绍: Awesome系列中的公开数据集\n\n* [《Search Engine & Community》](http://www.academics.io/)\n\n介绍: 一个学术搜索引擎\n\n* [《spaCy》](http://honnibal.github.io/spaCy/)\n\n介绍: 用Python和Cython写的工业级自然语言处理库，号称是速度最快的NLP库，快的原因一是用Cython写的，二是用了个很巧妙的hash技术，加速系统的瓶颈，NLP中稀松特征的存取\n\n* [《Collaborative Filtering with Spark》](http://fr.slideshare.net/MrChrisJohnson/collaborative-filtering-with-spark)\n\n介绍: [Fields](http://www.fields.utoronto.ca/video-archive/event/323/2014)是个数学研究中心,上面的这份ppt是来自Fields举办的活动中Russ Salakhutdinov带来的《大规模机器学习》分享\n\n* [《Topic modeling 的经典论文》](http://www.7300days.com/index.php/stds/topic/list/id/27/name/Topic%20modeling)\n\n介绍: Topic modeling 的经典论文,标注了关键点\n\n* [《Move Evaluation in Go Using Deep Convolutional Neural Networks》](http://arxiv.org/abs/1412.6564)\n\n介绍: 多伦多大学与Google合作的新论文，深度学习也可以用来下围棋，据说能达到六段水平\n\n* [《机器学习周刊第二期》](http://ztl2004.github.io/MachineLearningWeekly/issue2.html)\n\n介绍: 新闻，paper,课程，book，system,CES,Roboot，此外还推荐一个[深度学习入门与综述资料](http://blog.newitfarmer.com/ai/deep-learning/15302/repost-%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%85%A5%E9%97%A8%E4%B8%8E%E7%BB%BC%E8%BF%B0%E8%B5%84%E6%96%99)\n\n* [《Learning more like a human: 18 free eBooks on Machine Learning》](http://www.bigdata-madesimple.com/learning-more-like-a-human-18-free-ebooks-on-machine-learning/)\n\n介绍: 18 free eBooks on Machine Learning\n\n* [《Recommend :Hang Li Home》](http://www.hangli-hl.com/)\n\n介绍:Chief scientist of Noah's Ark Lab of Huawei Technologies.He worked at the Research Laboratories of NEC Corporation during 1990 and 2001 and Microsoft Research Asia during 2001 and 2012.[Paper](http://www.hangli-hl.com/recent-publications.html)\n\n* [《DEEPLEARNING.UNIVERSITY – AN ANNOTATED DEEP LEARNING BIBLIOGRAPHY》](http://memkite.com/deep-learning-bibliography/)\n\n介绍: DEEPLEARNING.UNIVERSITY的论文库已经收录了963篇经过分类的深度学习论文了，很多经典论文都已经收录\n\n* [《MLMU.cz - Radim Řehůřek - Word2vec & friends (7.1.2015)》](https://www.youtube.com/watch?v=wTp3P2UnTfQ&hd=1)\n\n介绍: Radim Řehůřek(Gensim开发者)在一次机器学习聚会上的报告，关于word2vec及其优化、应用和扩展，很实用.[国内网盘](http://pan.baidu.com/s/1c03wd24)\n\n* [《Introducing streaming k-means in Spark 1.2》](http://databricks.com/blog/2015/01/28/introducing-streaming-k-means-in-spark-1-2.html)\n\n介绍:很多公司都用机器学习来解决问题，提高用户体验。那么怎么可以让机器学习更实时和有效呢？Spark MLlib 1.2里面的Streaming K-means，由斑马鱼脑神经研究的Jeremy Freeman脑神经科学家编写，最初是为了实时处理他们每半小时1TB的研究数据，现在发布给大家用了。\n\n* [《LDA入门与Java实现》](http://www.hankcs.com/nlp/lda-java-introduction-and-implementation.html)\n\n介绍: 这是一篇面向工程师的LDA入门笔记，并且提供一份开箱即用Java实现。本文只记录基本概念与原理，并不涉及公式推导。文中的LDA实现核心部分采用了arbylon的LdaGibbsSampler并力所能及地注解了，在搜狗分类语料库上测试良好，开源在[GitHub](https://github.com/hankcs/LDA4j)上。\n\n* [《AMiner - Open Science Platform》](http://aminer.org/)\n\n介绍: AMiner是一个学术搜索引擎，从学术网络中挖掘深度知识、面向科技大数据的挖掘。收集近4000万作者信息、8000万论文信息、1亿多引用关系、链接近8百万知识点；支持专家搜索、机构排名、科研成果评价、会议排名。\n\n* [《What are some interesting Word2Vec results?》](https://www.quora.com/What-are-some-interesting-Word2Vec-results)\n\n介绍: Quora上的主题，讨论Word2Vec的有趣应用，Omer Levy提到了他在CoNLL2014最佳论文里的分析结果和新方法，Daniel Hammack给出了找特异词的小应用并提供了[(Python)代码](https://github.com/dhammack/Word2VecExample)\n\n* [《机器学习公开课汇总》](http://blog.coursegraph.com/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%85%AC%E5%BC%80%E8%AF%BE%E6%B1%87%E6%80%BB)\n\n介绍: 机器学习公开课汇总,虽然里面的有些课程已经归档过了，但是还有个别的信息没有。感谢课程图谱的小编\n\n* [《A First Course in Linear Algebra》](http://linear.ups.edu/download.html)\n\n介绍: 【A First Course in Linear Algebra】Robert Beezer 有答案 有移动版、打印版 使用GNU自由文档协议 引用了杰弗逊1813年的信\n\n* [《libfacedetection》](https://github.com/ShiqiYu/libfacedetection)\n\n介绍:libfacedetection是深圳大学开源的一个人脸图像识别库。包含正面和多视角人脸检测两个算法.优点:速度快(OpenCV haar+adaboost的2-3倍), 准确度高 (FDDB非公开类评测排名第二），能估计人脸角度。\n\n* [《Inverting a Steady-State》](http://dl.acm.org/citation.cfm?doid=2684822.2685310)\n\n介绍:WSDM2015最佳论文 把马尔可夫链理论用在了图分析上面，比一般的propagation model更加深刻一些。通过全局的平稳分布去求解每个节点影响系数模型。假设合理（转移受到相邻的影响系数影响）。可以用来反求每个节点的影响系数\n\n* [《机器学习入门书单》](http://pan.baidu.com/s/1pJogO7x)\n\n介绍:机器学习入门书籍，[具体介绍](http://www.hankcs.com/ml/machine-learning-entry-list.html)\n\n* [《The Trouble with SVMs》](http://v1v3kn.tumblr.com/post/47193952400/the-trouble-with-svms)\n\n介绍: 非常棒的强调特征选择对分类器重要性的文章。情感分类中，根据互信息对复杂高维特征降维再使用朴素贝叶斯分类器，取得了比SVM更理想的效果，训练和分类时间也大大降低——更重要的是，不必花大量时间在学习和优化SVM上——特征也一样no free lunch\n\n* [《Rise of the Machines》](http://www.stat.cmu.edu/~larry/Wasserman.pdf)\n\n介绍:CMU的统计系和计算机系知名教授Larry Wasserman 在《机器崛起》,对比了统计和机器学习的差异\n\n* [《实例详解机器学习如何解决问题》](http://tech.meituan.com/mt-mlinaction-how-to-ml.html)\n\n介绍:随着大数据时代的到来，机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界，机器学习都是一个炙手可热的方向，但是学术界和工业界对机器学习的研究各有侧重，学术界侧重于对机器学习理论的研究，工业界侧重于如何用机器学习来解决实际问题。这篇文章是美团的实际环境中的实战篇\n\n* [《Gaussian Processes for Machine Learning》](http://www.gaussianprocess.org/gpml/)\n\n介绍:面向机器学习的高斯过程，章节概要：回归、分类、协方差函数、模型选择与超参优化、高斯模型与其他模型关系、大数据集的逼近方法等,[微盘下载](http://vdisk.weibo.com/s/ayG13we2vfWuT)\n\n* [《FuzzyWuzzy: Fuzzy String Matching in Python》](http://chairnerd.seatgeek.com/fuzzywuzzy-fuzzy-string-matching-in-python/)\n\n介绍:Python下的文本模糊匹配库，老库新推，可计算串间ratio(简单相似系数)、partial_ratio(局部相似系数)、token_sort_ratio(词排序相似系数)、token_set_ratio(词集合相似系数)等 [github](https://github.com/seatgeek/fuzzywuzzy)\n\n* [《Blocks》](http://blocks.readthedocs.org/en/latest/)\n\n介绍:Blocks是基于Theano的神经网络搭建框架，集成相关函数、管道和算法，帮你更快地创建和管理NN模块.\n\n* [《Introduction to Machine Learning》](http://alex.smola.org/teaching/10-701-15/)\n\n介绍:机器学习大神Alex Smola在CMU新一期的机器学习入门课程”Introduction to Machine Learning“近期刚刚开课，课程4K高清视频同步到Youtube上，目前刚刚更新到 2.4 Exponential Families,课程视频[playlist](https://www.youtube.com/playlist?list=PLZSO_6-bSqHTTV7w9u7grTXBHMH-mw3qn), 感兴趣的同学可以关注，非常适合入门.\n\n* [《Collaborative Feature Learning from Social Media》](http://arxiv.org/abs/1502.01423)\n\n介绍:用社交用户行为学习图片的协同特征，可更好地表达图片内容相似性。由于不依赖于人工标签(标注)，可用于大规模图片处理，难在用户行为数据的获取和清洗；利用社会化特征的思路值得借鉴.\n\n* [《Introducing practical and robust anomaly detection in a time series》](https://blog.twitter.com/2015/introducing-practical-and-robust-anomaly-detection-in-a-time-series)\n\n介绍:Twitter技术团队对前段时间开源的时间序列异常检测算法(S-H-ESD)R包的介绍，其中对异常的定义和分析很值得参考，文中也提到——异常是强针对性的，某个领域开发的异常检测在其他领域直接用可不行.\n\n* [《Empower Your Team to Deal with Data-Quality Issues》](http://www.destinationcrm.com/Articles/Web-Exclusives/Viewpoints/Empower-Your-Team-to-Deal-with-Data-Quality-Issues-101308.aspx)\n\n介绍:聚焦数据质量问题的应对，数据质量对各种规模企业的性能和效率都至关重要，文中总结出(不限于)22种典型数据质量问题显现的信号，以及典型的数据质量解决方案(清洗、去重、统一、匹配、权限清理等)\n\n* [《中文分词入门之资源》](http://www.52nlp.cn/%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E5%85%A5%E9%97%A8%E4%B9%8B%E8%B5%84%E6%BA%90)\n\n介绍:中文分词入门之资源.\n\n* [《Deep Learning Summit, San Francisco, 2015》](https://www.youtube.com/playlist?list=PLnDbcXCpYZ8lCKExMs8k4PtIbani9ESX3)\n\n介绍:15年旧金山深度学习峰会视频集萃,[国内云盘](http://pan.baidu.com/s/1ntiLMcT)\n\n* [《Introduction to Conditional Random Fields》](http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/)\n\n介绍:很好的条件随机场(CRF)介绍文章,作者的学习笔记\n\n* [《A Fast and Accurate Dependency Parser using Neural Networks》](http://cs.stanford.edu/~danqi/papers/emnlp2014.pdf)\n\n介绍: 来自Stanford，用神经网络实现快速准确的依存关系解析器\n\n* [《Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning》](https://timdettmers.wordpress.com/2014/08/14/which-gpu-for-deep-learning/)\n\n介绍:做深度学习如何选择GPU的建议\n\n* [《Sparse Linear Models》](http://new.livestream.com/accounts/10932136/events/3779068)\n\n介绍: Stanford的Trevor Hastie教授在H2O.ai Meet-Up上的报告，讲稀疏线性模型——面向“宽数据”(特征维数超过样本数)的线性模型,13年同[主题报告](http://pan.baidu.com/s/1jimPw) 、[讲义](http://pan.baidu.com/s/1o6wqW6u).\n\n* [《Awesome Computer Vision》](https://github.com/jbhuang0604/awesome-computer-vision)\n\n介绍: 分类整理的机器视觉相关资源列表，秉承Awesome系列风格，有质有量!作者的更新频率也很频繁\n\n* [《Adam Szeidl》](http://www.personal.ceu.hu/staff/Adam_Szeidl/)\n\n介绍: social networks course\n\n* [《Building and deploying large-scale machine learning pipelines》](http://radar.oreilly.com/2015/01/building-and-deploying-large-scale-machine-learning-pipelines.html/)\n\n介绍: 大规模机器学习流程的构建与部署.\n\n* [《人脸识别开发包》](http://download.csdn.net/detail/lswtzw/8469997)\n\n介绍: 人脸识别二次开发包，免费，可商用，有演示、范例、说明书.\n\n* [《Understanding Natural Language with Deep Neural Networks Using Torch》](http://devblogs.nvidia.com/parallelforall/understanding-natural-language-deep-neural-networks-using-torch/)\n\n介绍: 采用Torch用深度学习网络理解NLP，来自Facebook 人工智能的文章.\n\n* [《The NLP Engine: A Universal Turing Machine for NLP》](http://arxiv.org/pdf/1503.00168.pdf)\n\n介绍: 来自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章,作者用Shannon Entropy来刻画NLP中各项任务的难度.\n\n* [《TThe Probabilistic Relevance Framework: BM25 and Beyond》](http://staff.city.ac.uk/~sb317/papers/foundations_bm25_review.pdf)\n\n介绍: 信息检索排序模型BM25(Besting Matching)。1）从经典概率模型演变而来 2）捕捉了向量空间模型中三个影响索引项权重的因子：IDF逆文档频率；TF索引项频率；文档长度归一化。3）并且含有集成学习的思想：组合了BM11和BM15两个模型。4）作者是BM25的提出者和Okapi实现者Robertson.\n\n* [《Introduction to ARMA Time Series Models – simplified》](http://www.analyticsvidhya.com/blog/2015/03/introduction-auto-regression-moving-average-time-series/)\n\n介绍: 自回归滑动平均(ARMA)时间序列的简单介绍，ARMA是研究时间序列的重要方法，由自回归模型（AR模型）与滑动平均模型（MA模型）为基础“混合”构成.\n\n* [《Encoding Source Language with Convolutional Neural Network for Machine Translation》](http://arxiv.org/pdf/1503.01838v1.pdf)\n\n介绍: 把来自target的attention signal加入source encoding CNN的输入，得到了比BBN的模型好的多neural network joint model\n\n* [《Spices form the basis of food pairing in Indian cuisine》](http://arxiv.org/abs/1502.03815)\n\n介绍: 揭开印度菜的美味秘诀——通过对大量食谱原料关系的挖掘，发现印度菜美味的原因之一是其中的味道互相冲突，很有趣的文本挖掘研究\n\n* [《HMM相关文章索引》](http://www.52nlp.cn/hmm%E7%9B%B8%E5%85%B3%E6%96%87%E7%AB%A0%E7%B4%A2%E5%BC%95)\n\n介绍: HMM相关文章,此外推荐[中文分词之HMM模型详解](http://yanyiwu.com/work/2014/04/07/hmm-segment-xiangjie.html)\n\n* [《Zipf's and Heap's law》](http://www.ccs.neu.edu/home/ekanou/ISU535.09X2/Handouts/Review_Material/zipfslaw.pdf)\n\n介绍: 1)词频与其降序排序的关系,最著名的是语言学家齐夫(Zipf,1902-1950)1949年提出的Zipf‘s law,即二者成反比关系. 曼德勃罗(Mandelbrot,1924- 2010)引入参数修正了对甚高频和甚低频词的刻画 2)Heaps' law: 词汇表与语料规模的平方根(这是一个参数,英语0.4-0.6)成正比\n\n* [《I am Jürgen Schmidhuber, AMA》](http://www.reddit.com/r/MachineLearning/comments/2xcyrl/i_am_j%C3%BCrgen_schmidhuber_ama/)\n\n介绍: Jürgen Schmidhuber在Reddit上的AMA(Ask Me Anything)主题，有不少RNN和AI、ML的干货内容，关于开源&思想&方法&建议……耐心阅读，相信你也会受益匪浅.\n\n* [《学术种子网站：AcademicTorrents》](http://academictorrents.com/)\n\n介绍: 成G上T的学术数据，HN近期热议话题,主题涉及机器学习、NLP、SNA等。下载最简单的方法，通过BT软件，RSS订阅各集合即可\n\n* [《机器学习交互速查表》](http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html)\n\n介绍: Scikit-Learn官网提供，在原有的Cheat Sheet基础上加上了Scikit-Learn相关文档的链接，方便浏览\n\n* [《A Full Hardware Guide to Deep Learning》](https://timdettmers.wordpress.com/2015/03/09/deep-learning-hardware-guide/)\n\n介绍: 深度学习的全面硬件指南，从GPU到RAM、CPU、SSD、PCIe\n\n* [《行人检测(Pedestrian Detection)资源》](http://hi.baidu.com/susongzhi/item/085983081b006311eafe38e7)\n\n介绍:Pedestrian Detection paper & data\n\n* [《A specialized face-processing network consistent with the representational geometry of monkey face patches》](http://arxiv.org/abs/1502.01241)\n\n介绍: 【神经科学碰撞人工智能】在脸部识别上你我都是专家，即使细微的差别也能辨认。研究已证明人类和灵长类动物在面部加工上不同于其他物种，人类使用梭状回面孔区（FFA）。Khaligh-Razavi等通过计算机模拟出人脸识别的FFA活动，堪称神经科学与人工智能的完美结合。\n\n* [《Neural Net in C++ Tutorial》](https://vimeo.com/19569529)\n\n介绍: 神经网络C++教程,本文介绍了用可调节梯度下降和可调节动量法设计和编码经典BP神经网络，网络经过训练可以做出惊人和美妙的东西出来。此外作者博客的其他文章也很不错。\n\n* [《How to Choose a Neural Network》](http://deeplearning4j.org/neuralnetworktable.html)\n\n介绍:deeplearning4j官网提供的实际应用场景NN选择参考表，列举了一些典型问题建议使用的神经网络\n\n* [《Deep Learning (Python, C/C++, Java, Scala, Go)》](https://github.com/yusugomori/DeepLearning)\n\n介绍:一个深度学习项目,提供了Python, C/C++, Java, Scala, Go多个版本的代码\n\n* [《Deep Learning Tutorials》](http://deeplearning.net/tutorial/)\n\n介绍:深度学习教程,[github](https://github.com/lisa-lab/DeepLearningTutorials)\n\n* [《自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授》](http://www.ccf.org.cn/resources/1190201776262/2015/03/12/15.pdf)\n\n介绍:自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授.\n\n* [《FaceNet: A Unified Embedding for Face Recognition and Clustering》](http://arxiv.org/abs/1503.03832)\n\n介绍:Google对Facebook DeepFace的有力回击—— FaceNet，在LFW(Labeled Faces in the Wild)上达到99.63%准确率(新纪录)，FaceNet embeddings可用于人脸识别、鉴别和聚类.\n\n* [《MLlib中的Random Forests和Boosting》](http://databricks.com/blog/2015/01/21/random-forests-and-boosting-in-mllib.html)\n\n介绍:本文来自Databricks公司网站的一篇博客文章，由Joseph Bradley和Manish Amde撰写，文章主要介绍了Random Forests和Gradient-Boosted Trees（GBTs）算法和他们在MLlib中的分布式实现，以及展示一些简单的例子并建议该从何处上手.[中文版](http://www.csdn.net/article/2015-03-11/2824178).\n\n* [《Sum-Product Networks(SPN) 》](http://spn.cs.washington.edu/index.shtml)\n\n介绍:华盛顿大学Pedro Domingos团队的DNN，提供论文和实现代码.\n\n* [《Neural Network Dependency Parser》](http://nlp.stanford.edu/software/nndep.shtml)\n\n介绍:基于神经网络的自然语言依存关系解析器(已集成至Stanford CoreNLP)，特点是超快、准确，目前可处理中英文语料，基于[《A Fast and Accurate Dependency Parser Using Neural Networks》](http://cs.stanford.edu/~danqi/papers/emnlp2014.pdf) 思路实现.\n\n* [《神经网络语言模型》](http://www.flickering.cn/nlp/2015/03/%E6%88%91%E4%BB%AC%E6%98%AF%E8%BF%99%E6%A0%B7%E7%90%86%E8%A7%A3%E8%AF%AD%E8%A8%80%E7%9A%84-3%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B/)\n\n介绍:本文根据神经网络的发展历程，详细讲解神经网络语言模型在各个阶段的形式，其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变形，总结的特别好.\n\n* [《Classifying Spam Emails using Text and Readability Features》](http://www.elg.uottawa.ca/~nat/Courses/csi5387_Winter2014/paper13.pdf)\n\n介绍:经典问题的新研究：利用文本和可读性特征分类垃圾邮件。\n\n* [《BCI Challenge @ NER 2015》](https://github.com/alexandrebarachant/bci-challenge-ner-2015)\n\n介绍:[Kaggle脑控计算机交互(BCI)竞赛](https://www.kaggle.com/c/inria-bci-challenge)优胜方案源码及文档，包括完整的数据处理流程，是学习Python数据处理和Kaggle经典参赛框架的绝佳实例\n\n* [《IPOL Journal · Image Processing On Line》](http://www.ipol.im/)\n\n介绍:IPOL（在线图像处理）是图像处理和图像分析的研究期刊，每篇文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作，拉近产品和技术之间的距离.\n\n* [《Machine learning classification over encrypted data》](http://eprint.iacr.org/2014/331)\n\n介绍:出自MIT，研究加密数据高效分类问题.\n\n* [《purine2》](https://github.com/purine/purine2)\n\n介绍:新加坡LV实验室的神经网络并行框架[Purine: A bi-graph based deep learning framework](http://arxiv.org/abs/1412.6249),支持构建各种并行的架构，在多机多卡，同步更新参数的情况下基本达到线性加速。12块Titan 20小时可以完成Googlenet的训练。\n\n* [《Machine Learning Resources》](http://michal.io/machine-learning-resources/)\n\n介绍:这是一个机器学习资源库,虽然比较少.但蚊子再小也是肉.有突出部分.此外还有一个由[zheng Rui整理的机器学习资源](http://zhengrui.github.io/zerryland/ML-CV-Resource.html).\n\n* [《Hands-on with machine learning》](https://github.com/cjdd3b/nicar2015/tree/master/machine-learning)\n\n介绍:Chase Davis在NICAR15上的主题报告材料，用Scikit-Learn做监督学习的入门例子.\n\n* [《The Natural Language Processing Dictionary》](http://www.cse.unsw.edu.au/~billw/nlpdict.html)\n\n介绍:这是一本自然语言处理的词典,从1998年开始到目前积累了成千上万的专业词语解释,如果你是一位刚入门的朋友.可以借这本词典让自己成长更快.\n\n* [《PageRank Approach to Ranking National Football Teams》](http://arxiv.org/abs/1503.01331)\n\n介绍:通过分析1930年至今的比赛数据，用PageRank计算世界杯参赛球队排行榜.\n\n* [《R Tutorial》](http://cyclismo.org/tutorial/R/)\n\n介绍:R语言教程,此外还推荐一个R语言教程[An Introduction to R](http://cran.r-project.org/doc/manuals/R-intro.html).\n\n* [《Fast unfolding of communities in large networks》](http://arxiv.org/abs/0803.0476)\n\n介绍:经典老文，复杂网络社区发现的高效算法，Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.\n\n* [《NUML》](http://numl.net/)\n\n介绍: 一个面向 .net 的开源机器学习库,[github地址](https://github.com/sethjuarez/numl)\n\n* [《synaptic.Js》](http://synaptic.juancazala.com/)\n\n介绍: 支持node.js的JS神经网络库，可在客户端浏览器中运行，支持LSTM等 [github地址](https://github.com/cazala/synaptic)\n\n* [《Machine learning for package users with R (1): Decision Tree》](http://tjo-en.hatenablog.com/entry/2015/03/20/191614)\n\n介绍: 决策树，推荐决策树相关论文[阅读列表](https://github.com/benedekrozemberczki/awesome-decision-tree-papers)\n\n* [《Deep Learning, The Curse of Dimensionality, and Autoencoders》](http://www.kdnuggets.com/2015/03/deep-learning-curse-dimensionality-autoencoders.html)\n\n介绍:  讨论深度学习自动编码器如何有效应对维数灾难,[国内翻译](http://www.36dsj.com/archives/26223)\n\n* [《Advanced Optimization and Randomized Methods》](http://www.cs.cmu.edu/~suvrit/teach/)\n\n介绍: CMU的优化与随机方法课程，由A. Smola和S. Sra主讲，优化理论是机器学习的基石，值得深入学习 [国内云(视频)](http://pan.baidu.com/s/1c0cZtQC)\n\n* [《CS231n: Convolutional Neural Networks for Visual Recognition》](http://cs231n.stanford.edu/reports.html)\n\n介绍: \"面向视觉识别的CNN\"课程设计报告集锦.近百篇，内容涉及图像识别应用的各个方面\n\n* [《Topic modeling with LDA: MLlib meets GraphX》](http://databricks.com/blog/2015/03/25/topic-modeling-with-lda-mllib-meets-graphx.html)\n\n介绍:用Spark的MLlib+GraphX做大规模LDA主题抽取.\n\n* [《Deep Learning for Multi-label Classification》](http://arxiv.org/abs/1502.05988)\n\n介绍: 基于深度学习的多标签分类,用基于RBM的DBN解决多标签分类(特征)问题\n\n* [《Google DeepMind publications》](http://deepmind.com/publications.html)\n\n介绍: DeepMind论文集锦\n\n* [《kaldi》](http://kaldi-asr.org/)\n\n介绍: 一个开源语音识别工具包,它目前托管在[sourceforge](http://sourceforge.net/projects/kaldi/)上面\n\n* [《Data Journalism Handbook》](http://datajournalismhandbook.org/)\n\n介绍: 免费电子书《数据新闻手册》, 国内有热心的朋友翻译了[中文版](http://datajournalismhandbook.org/chinese/index.html),大家也可以[在线阅读](http://datajournalismhandbook.org/1.0/en/)\n\n* [《Data Mining Problems in Retail》](https://highlyscalable.wordpress.com/2015/03/10/data-mining-problems-in-retail/)\n\n介绍: 零售领域的数据挖掘文章.\n\n* [《Understanding Convolution in Deep Learning》](https://timdettmers.com/2015/03/26/convolution-deep-learning/)\n\n介绍: 深度学习卷积概念详解,深入浅出.\n\n* [《pandas: powerful Python data analysis toolkit》](http://pandas.pydata.org/)\n\n介绍: 非常强大的Python的数据分析工具包.\n\n* [《Text Analytics 2015》](http://breakthroughanalysis.com/2015/03/23/text-analytics-2015/)\n\n介绍: 2015文本分析(商业)应用综述.\n\n* [《Deep Learning libraries and ﬁrst experiments with Theano》](http://www.slideshare.net/VincenzoLomonaco/deep-learning-libraries-and-rst-experiments-with-theano)\n\n介绍: 深度学习框架、库调研及Theano的初步测试体会报告.\n\n* [《DEEP learning》](http://www.deeplearningbook.org/)\n\n介绍:  MIT的Yoshua Bengio, Ian Goodfellow, Aaron Courville著等人讲深度学习的新书，还未定稿，线上提供Draft chapters收集反馈，超赞！强烈推荐.\n\n* [《simplebayes》](https://github.com/hickeroar/simplebayes)\n\n介绍: Python下开源可持久化朴素贝叶斯分类库.\n\n* [《Paracel》](http://paracel.io/)\n\n介绍:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.\n\n* [《HanLP:Han Language processing》](http://hanlp.linrunsoft.com/)\n\n介绍: 开源汉语言处理包.\n\n* [《Simple Neural Network implementation in Ruby》](http://www.rubylab.io/2015/03/18/simple-neural-network-implenentation-in-ruby/)\n\n介绍: 使用Ruby实现简单的神经网络例子.\n\n* [《Hacker's guide to Neural Networks》](https://karpathy.github.io/neuralnets/)\n\n介绍:神经网络黑客入门.\n\n* [《The Open-Source Data Science Masters》](http://datasciencemasters.org/)\n\n介绍:好多数据科学家名人推荐,还有资料.\n\n* [《Text Understanding from Scratch》](http://arxiv.org/abs/1502.01710)\n\n介绍:实现项目已经开源在github上面[Crepe](https://github.com/zhangxiangxiao/Crepe)\n\n* [《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》](https://levyomer.files.wordpress.com/2015/03/improving-distributional-similarity-tacl-2015.pdf)\n\n介绍:作者发现，经过调参，传统的方法也能和word2vec取得差不多的效果。另外，无论作者怎么试，GloVe都比不过word2vec.\n\n* [《CS224d: Deep Learning for Natural Language Processing》](http://cs224d.stanford.edu/index.html)\n\n介绍:Stanford深度学习与自然语言处理课程,Richard Socher主讲.\n\n* [《Math Essentials in Machine Learning》](http://courses.washington.edu/css490/2012.Winter/lecture_slides/02_math_essentials.pdf)\n\n介绍:机器学习中的重要数学概念.\n\n* [《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》](http://arxiv.org/abs/1503.00007)\n\n介绍:用于改进语义表示的树型LSTM递归神经网络,句子级相关性判断和情感分类效果很好.[实现代码](https://github.com/stanfordnlp/treelstm).\n\n* [《Statistical Machine Learning》](http://www.stat.cmu.edu/~larry/=sml/)\n\n介绍:卡耐基梅隆Ryan Tibshirani和Larry Wasserman开设的机器学习课程，先修课程为机器学习(10-715)和中级统计学(36-705)，聚焦统计理论和方法在机器学习领域应用.\n\n* [《AM207: Monte Carlo Methods, Stochastic Optimization》](http://am207.org/)\n\n介绍:《哈佛大学蒙特卡洛方法与随机优化课程》是哈佛应用数学研究生课程，由V Kaynig-Fittkau、P Protopapas主讲，Python程序示例，对贝叶斯推理感兴趣的朋友一定要看看，提供授[课视频及课上IPN讲义](http://nbviewer.ipython.org/github/AM207/2015/tree/master/Lectures/).\n\n* [《生物医学的SPARK大数据应用》](http://spark-summit.org/wp-content/uploads/2015/03/SSE15-40-Danford.pdf)\n\n介绍:生物医学的SPARK大数据应用.并且伯克利开源了他们的big data genomics系统[ADAM](https://github.com/bigdatagenomics/adam)，其他的内容可以关注一下[官方主页](http://spark-summit.org/).\n\n* [《ACL Anthology》](http://aclanthology.info/)\n\n介绍:对自然语言处理技术或者机器翻译技术感兴趣的亲们，请在提出自己牛逼到无以伦比的idea（自动归纳翻译规律、自动理解语境、自动识别语义等等）之前，请通过谷歌学术简单搜一下，如果谷歌不可用，这个网址有这个领域几大顶会的论文列表,切不可断章取义,胡乱假设.\n\n* [《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》](http://www.uni-weimar.de/medien/webis/publications/papers/stein_2015b.pdf)\n\n介绍:论文+代码:基于集成方法的Twitter情感分类,[实现代码](https://github.com/webis-de/ECIR-2015-and-SEMEVAL-2015).\n\n* [《NIPS 2014 CIML workshop》](http://ciml.chalearn.org/schedule)\n\n介绍:NIPS CiML 2014的PPT,NIPS是神经信息处理系统进展大会的英文简称.\n\n* [《CS231n: Convolutional Neural Networks for Visual Recognition》](http://cs231n.stanford.edu/reports.html)\n\n介绍:斯坦福的深度学习课程的Projects 每个人都要写一个论文级别的报告 里面有一些很有意思的应用 大家可以看看 .\n\n* [《A Speed Comparison Between Flexible Linear Regression Alternatives in R》](http://www.sumsar.net/blog/2015/03/a-speed-comparison-between-flexible-linear-regression-alternatives-in-r/)\n\n介绍:R语言线性回归多方案速度比较具体方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.\n\n* [《Back-to-Basics Weekend Reading - Machine Learning》](http://www.allthingsdistributed.com/2015/04/machine-learning.html)\n\n介绍:文中提到的三篇论文（机器学习那些事、无监督聚类综述、监督分类综述）都很经典，Domnigos的机器学习课也很精彩\n\n* [《A Probabilistic Theory of Deep Learning》](http://arxiv.org/abs/1504.00641)\n\n介绍:莱斯大学（Rice University）的深度学习的概率理论.\n\n* [《Nonsensical beer reviews via Markov chains》](http://www.gregreda.com/2015/03/30/beer-review-markov-chains/)\n\n介绍:基于马尔可夫链自动生成啤酒评论的开源Twitter机器人,[github地址](https://github.com/gjreda/beer-snob-says).\n\n* [《Deep Learning for Natural Language Processing (without Magic)》](http://nlp.stanford.edu/courses/NAACL2013/)\n\n介绍:视频+讲义:深度学习用于自然语言处理教程(NAACL13).\n\n* [《Introduction to Data Analysis using Machine Learning》](https://www.youtube.com/watch?v=U4IYsLgNgoY&hd=1)\n\n介绍:用机器学习做数据分析,David Taylor最近在McGill University研讨会上的报告，还提供了一系列讲机器学习方法的ipn，很有价值 [GitHub](https://github.com/Prooffreader/intro_machine_learning).[国内](http://pan.baidu.com/s/1mgtE9te)\n\n* [《Beyond Short Snippets: Deep Networks for Video Classification》](http://arxiv.org/abs/1503.08909)\n\n介绍:基于CNN+LSTM的视频分类,[google演示](http://pan.baidu.com/s/1c0cZS9E).\n\n* [《How does Quora use machine learning in 2015?》](http://www.quora.com/How-does-Quora-use-machine-learning-in-2015/answer/Xavier-Amatriain)\n\n介绍:Quora怎么用机器学习.\n\n* [《Amazon Machine Learning – Make Data-Driven Decisions at Scale》](https://aws.amazon.com/cn/blogs/aws/amazon-machine-learning-make-data-driven-decisions-at-scale/)\n\n介绍:亚马逊在机器学习上面的一些应用,[代码示例](https://github.com/awslabs/machine-learning-samples).\n\n* [《Parallel Machine Learning with scikit-learn and IPython》](https://github.com/ogrisel/parallel_ml_tutorial)\n\n介绍:并行机器学习指南(基于scikit-learn和IPython).[notebook](http://nbviewer.ipython.org/github/ogrisel/parallel_ml_tutorial/tree/master/notebooks/)\n\n* [《Intro to machine learning with scikit-learn》](http://blog.kaggle.com/2015/04/08/new-video-series-introduction-to-machine-learning-with-scikit-learn/)\n\n介绍:DataSchool的机器学习基本概念教学.\n\n* [《DeepCLn》](https://github.com/hughperkins/DeepCL)\n\n介绍:一个基于OpenGL实现的卷积神经网络，支持Linux及Windows系.\n\n* [《An Inside Look at the Components of a Recommendation Engine》](https://www.mapr.com/blog/inside-look-at-components-of-recommendation-engine)\n\n介绍:基于Mahout和Elasticsearch的推荐系统.\n\n* [《Forecasting in Economics, Business, Finance and Beyond》](http://www.ssc.upenn.edu/~fdiebold/Teaching221/econ221.html)\n\n介绍:Francis X. Diebold的《(经济|商业|金融等领域)预测方法.\n\n* [《Time Series Econometrics - A Concise Course》](http://www.ssc.upenn.edu/~fdiebold/Teaching706/econ706Penn.html)\n\n介绍:Francis X. Diebold的《时序计量经济学》.\n\n* [《A comparison of open source tools for sentiment analysis》](http://fotiad.is/blog/sentiment-analysis-comparison/)\n\n介绍:基于Yelp数据集的开源[情感分析工具](https://github.com/sfotiadis/yenlp)比较,评测覆盖Naive Bayes、SentiWordNet、CoreNLP等 .\n\n* [《Pattern Recognition And Machine Learning》](http://vdisk.weibo.com/s/ayG13we2u_sAZ)\n\n介绍:国内Pattern Recognition And Machine Learning读书会资源汇总,[各章pdf讲稿](http://vdisk.weibo.com/u/1841149974),[博客](http://www.cnblogs.com/Nietzsche/).\n\n* [《Probabilistic Data Structures for Web Analytics and Data Mining 》](https://highlyscalable.wordpress.com/2012/05/01/probabilistic-structures-web-analytics-data-mining/)\n\n介绍:用于Web分析和数据挖掘的概率数据结构.\n\n* [《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》](https://blindmotion.github.io/2015/04/11/ml-in-navigation/)\n\n介绍:机器学习在导航上面的应用.\n\n* [《Neural Networks Demystified 》](https://www.youtube.com/user/Taylorns34/videos)\n\n介绍:Neural Networks Demystified系列视频，Stephen Welch制作，纯手绘风格，浅显易懂,[国内云](http://pan.baidu.com/s/1i3AFURj).\n\n* [《swirl + DataCamp 》](https://www.datacamp.com/swirl-r-tutorial)\n\n介绍:{swirl}数据训练营:R&数据科学在线交互教程.\n\n* [《Learning to Read with Recurrent Neural Networks 》](http://blog.terminal.com/recurrent-neural-networks-deep-net-optimization-lstm/)\n\n介绍:关于深度学习和RNN的讨论 [Sequence to Sequence Learning with Neural Networks](http://arxiv.org/abs/1409.3215).\n\n* [《深度强化学习（Deep Reinforcement Learning）的资源》](http://wanghaitao8118.blog.163.com/blog/static/13986977220153811210319/)\n\n介绍:Deep Reinforcement Learning.\n\n* [《Machine Learning with Scikit-Learn》](https://github.com/jakevdp/sklearn_pycon2015)\n\n介绍:(PyCon2015)Scikit-Learn机器学习教程,[Parallel Machine Learning with scikit-learn and IPython](https://github.com/ogrisel/parallel_ml_tutorial).\n\n* [《PDNN》](http://www.cs.cmu.edu/~ymiao/pdnntk.html)\n\n介绍:PDNN: A Python Toolkit for Deep Learning.\n\n* [《Introduction to Machine Learning》](http://alex.smola.org/teaching/10-701-15/index.html)\n\n介绍:15年春季学期CMU的机器学习课程，由Alex Smola主讲，提供讲义及授课视频，很不错.[国内镜像](http://pan.baidu.com/s/1pJxBePX).\n\n* [《Big Data Processing》](http://www.st.ewi.tudelft.nl/~hauff/TI2736-B.html)\n\n介绍:大数据处理课.内容覆盖流处理、MapReduce、图算法等.\n\n* [《Spark MLlib: Making Practical Machine Learning Easy and Scalable》](https://www.hakkalabs.co/articles/spark-mllib-making-practical-machine-learning-easy-and-scalable)\n\n介绍:用Spark MLlib实现易用可扩展的机器学习,[国内镜像](http://pan.baidu.com/s/1gdxSOZh).\n\n* [《Picture: A Probabilistic Programming Language for Scene Perception》](http://mrkulk.github.io/www_cvpr15/)\n\n介绍:以往上千行代码概率编程(语言)实现只需50行.\n\n* [《Beautiful plotting in R: A ggplot2 cheatsheet》](http://zevross.com/blog/2014/08/04/beautiful-plotting-in-r-a-ggplot2-cheatsheet-3/)\n\n介绍:ggplot2速查小册子,[另外一个](http://www.ling.upenn.edu/~joseff/avml2012/),此外还推荐[《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》](http://zevross.com/blog/2015/01/13/a-new-data-processing-workflow-for-r-dplyr-magrittr-tidyr-ggplot2/).\n\n* [《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》](http://emnlp2014.org/papers/pdf/EMNLP2014148.pdf)\n\n介绍:用结构化模型来预测实时股票行情.\n\n* [《International Joint Conference on Artificial Intelligence Accepted paper》](http://ijcai-15.org/index.php/accepted-papers)\n\n介绍:[国际人工智能联合会议](http://ijcai.org/)录取论文列表,大部分论文可使用Google找到.\n\n* [《Why GEMM is at the heart of deep learning》](http://petewarden.com/2015/04/20/why-gemm-is-at-the-heart-of-deep-learning/)\n\n介绍:一般矩阵乘法(GEMM)对深度学习的重要性.\n\n* [《Distributed (Deep) Machine Learning Common》](https://github.com/dmlc)\n\n介绍:A Community of awesome Distributed Machine Learning C++ projects.\n\n* [《Reinforcement Learning: An Introduction》](http://webdocs.cs.ualberta.ca/~sutton/book/the-book.html)\n\n介绍:免费电子书<强化学习介绍>,[第一版(1998)](http://pan.baidu.com/s/1jkaMq),[第二版(2015草稿)](http://pan.baidu.com/s/1dDnNEnR),相关课程[资料](http://incompleteideas.net/rlai.cs.ualberta.ca/RLAI/RLAIcourse/2010.html),[Reinforcement Learning](http://www.inf.ed.ac.uk/teaching/courses/rl/).\n\n* [《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》](http://blogs.msdn.com/b/microsoft_press/archive/2015/04/15/free-ebook-microsoft-azure-essentials-azure-machine-learning.aspx)\n\n介绍:免费书:Azure ML使用精要.\n\n* [《A Deep Learning Tutorial: From Perceptrons to Deep Networks》](http://www.toptal.com/machine-learning/an-introduction-to-deep-learning-from-perceptrons-to-deep-networks)\n\n介绍:A Deep Learning Tutorial: From Perceptrons to Deep Networks.\n\n* [《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》](https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471)\n\n介绍:有趣的机器学习：最简明入门指南,[中文版](http://blog.jobbole.com/67616/).\n\n* [《A Brief Overview of Deep Learning》](yyue.blogspot.com/2015/01/a-brief-overview-of-deep-learning.html)\n\n介绍:深度学习简明介绍,[中文版](http://xhrwang.me/2015/01/16/a-brief-overview-of-deep-learning.html).\n\n* [《Wormhole》](https://github.com/dmlc/wormhole)\n\n介绍:Portable, scalable and reliable distributed machine learning.\n\n* [《convnet-benchmarks》](https://github.com/soumith/convnet-benchmarks)\n\n介绍:CNN开源实现横向评测,参评框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等，NervanaSys表现突出.\n\n* [《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》](http://islpc21.is.cs.cmu.edu:3000/lti_catalogue)\n\n介绍:卡耐基梅隆大学计算机学院语言技术系的资源大全,包括大量的NLP开源软件工具包，基础数据集，论文集，数据挖掘教程，机器学习资源.\n\n* [《Sentiment Analysis on Twitter》](https://github.com/mayank93/Twitter-Sentiment-Analysis)\n\n介绍:Twitter情感分析工具SentiTweet,[视频+讲义](http://pan.baidu.com/s/1i3kXPlj).\n\n* [《Machine Learning Repository @ Wash U》](http://machinelearning.wustl.edu/mlpapers/venues)\n\n介绍:华盛顿大学的Machine Learning Paper Repository.\n\n* [《Machine learning cheat sheet》](https://github.com/soulmachine/machine-learning-cheat-sheet)\n\n介绍:机器学习速查表.\n\n* [《Spark summit east 2015 agenda》](http://spark-summit.org/east)\n\n介绍:最新的Spark summit会议资料.\n\n* [《Spark summit east 2015 agenda》](http://spark-summit.org/east)\n\n介绍:最新的Spark summit会议资料.\n\n* [《Learning Spark》](http://pan.baidu.com/s/1eQkybJG)\n\n介绍:Ebook Learning Spark.\n\n* [《Advanced Analytics with Spark, Early Release Edition》](http://pan.baidu.com/s/1jGot9qe)\n\n介绍:Ebook Advanced Analytics with Spark, Early Release Edition.\n\n* [《国内机器学习算法及应用领域人物篇:唐杰》](http://keg.cs.tsinghua.edu.cn/jietang/)\n\n介绍:清华大学副教授，是图挖掘方面的专家。他主持设计和实现的Arnetminer是国内领先的图挖掘系统，该系统也是多个会议的支持商.\n\n* [《国内机器学习算法及应用领域人物篇:杨强》](http://www.cse.ust.hk/~qyang/)\n\n介绍:迁移学习的国际领军人物.\n\n* [《国内机器学习算法及应用领域人物篇:周志华》](http://cs.nju.edu.cn/zhouzh/)\n\n介绍:在半监督学习，multi-label学习和集成学习方面在国际上有一定的影响力.\n\n* [《国内机器学习算法及应用领域人物篇:王海峰》](http://ir.hit.edu.cn/~wanghaifeng/whf_pub.htm)\n\n介绍:信息检索，自然语言处理，机器翻译方面的专家.\n\n* [《国内机器学习算法及应用领域人物篇:吴军》](http://www.cs.jhu.edu/~junwu/)\n\n介绍:吴军博士是当前Google中日韩文搜索算法的主要设计者。在Google其间，他领导了许多研发项目，包括许多与中文相关的产品和自然语言处理的项目,他的[新个人主页](https://sites.google.com/site/junwu02).\n\n* [《Cat Paper Collection》](http://www.eecs.berkeley.edu/~junyanz/cat/cat_papers.html)\n\n介绍:喵星人相关论文集.\n\n* [《How to Evaluate Machine Learning Models, Part 1: Orientation》](http://blog.dato.com/how-to-evaluate-machine-learning-models-part-1-orientation)\n\n介绍:如何评价机器学习模型系列文章,[How to Evaluate Machine Learning Models, Part 2a: Classification Metrics](http://blog.dato.com/how-to-evaluate-machine-learning-models-part-2a-classification-metrics),[How to Evaluate Machine Learning Models, Part 2b: Ranking and Regression Metrics](http://blog.dato.com/how-to-evaluate-machine-learning-models-part-2b-ranking-and-regression-metrics).\n\n* [《Building a new trends experience》](https://blog.twitter.com/2015/building-a-new-trends-experience)\n\n介绍:Twitter新trends的基本实现框架.\n\n* [《Storm Blueprints: Patterns for Distributed Real-time Computation》](https://www.packtpub.com/big-data-and-business-intelligence/storm-blueprints-patterns-distributed-real-time-computation)\n\n介绍:Storm手册，国内有[中文翻译版本](https://github.com/cjie888/storm-trident),谢谢作者.\n\n* [《SmileMiner》](https://github.com/haifengl/smile)\n\n介绍:Java机器学习算法库SmileMiner.\n\n* [《机器翻译学术论文写作方法和技巧》](http://nlp.csai.tsinghua.edu.cn/~ly/talks/cwmt14_tut.pdf)\n\n介绍:机器翻译学术论文写作方法和技巧，Simon Peyton Jones的[How to write a good research paper](http://research.microsoft.com/en-us/um/people/simonpj/papers/giving-a-talk/giving-a-talk.htm)同类视频[How to Write a Great Research Paper](https://www.youtube.com/watch?v=g3dkRsTqdDA),[how to paper talk](http://vdisk.weibo.com/s/ayG13we2volht).\n\n* [《神经网络训练中的Tricks之高效BP（反向传播算法）》](http://blog.csdn.net/zouxy09/article/details/45288129)\n\n介绍:神经网络训练中的Tricks之高效BP,博主的其他博客也挺精彩的.\n\n* [《我和NLP的故事》](http://www.52cs.org/?p=499)\n\n介绍:作者是NLP方向的硕士，短短几年内研究成果颇丰,推荐新入门的朋友阅读.\n\n* [《The h Index for Computer Science 》](http://www.cs.ucla.edu/~palsberg/h-number.html)\n\n介绍:UCLA的Jens Palsberg根据Google Scholar建立了一个计算机领域的H-index牛人列表,我们熟悉的各个领域的大牛绝大多数都在榜上，包括1位诺贝尔奖得主，35位图灵奖得主，近百位美国工程院/科学院院士，300多位ACM Fellow,在这里推荐的原因是大家可以在google通过搜索牛人的名字来获取更多的资源,这份资料很宝贵.\n\n* [《Structured Learning for Taxonomy Induction with Belief Propagation》](http://ttic.uchicago.edu/~mbansal/papers/acl14_structuredTaxonomy.pdf)\n\n介绍:用大型语料库学习概念的层次关系，如鸟是鹦鹉的上级，鹦鹉是虎皮鹦鹉的上级。创新性在于模型构造，用因子图刻画概念之间依存关系，因引入兄弟关系，图有环，所以用有环扩散（loopy propagation）迭代计算边际概率（marginal probability）.\n\n* [《Bayesian analysis》](http://www.stata.com/stata14/bayesian-analysis/)\n\n介绍: 这是一款贝叶斯分析的商业软件,官方写的[贝叶斯分析的手册](http://www.stata.com/manuals14/bayes.pdf)有250多页,虽然R语言 已经有类似的[项目](http://cran.r-project.org/web/views/Bayesian.html),但毕竟可以增加一个可选项.\n\n* [《deep net highlights from 2014》](http://www.quora.com/Boris-Babenko/Posts/deep-net-highlights-from-2014)\n\n介绍:deep net highlights from 2014.\n\n* [《Fast R-CNN》](http://arxiv.org/pdf/1504.08083v1.pdf)\n\n介绍:This paper proposes Fast R-CNN, a clean and fast framework for object detection.\n\n* [《Fingerprinting Images for Near-Duplicate Detection》](https://realpython.com/blog/python/fingerprinting-images-for-near-duplicate-detection/)\n\n介绍:图像指纹的重复识别,作者[源码](https://github.com/realpython/image-fingerprinting/blob/master/code/output.csv),国内[翻译版本](http://www.cnblogs.com/wing1995/p/4471034.html).\n\n* [《The Computer Vision Industry 》](http://www.cs.ubc.ca/~lowe/vision.html)\n\n介绍:提供计算机视觉、机器视觉应用的公司信息汇总.应用领域包括：自动辅助驾驶和交通管理、眼球和头部跟踪、影视运动分析、影视业、手势识别、通用视觉系统、各种工业自动化和检验、医药和生物、移动设备目标识别和AR、人群跟踪、摄像、安全监控、生物监控、三维建模、web和云应用.\n\n* [《Seaborn: statistical data visualization》](https://github.com/mwaskom/seaborn)\n\n介绍:Python版可视化数据统计开源库.\n\n* [《IPython lecture notes for OCW MIT 18.06》](http://www.juanklopper.com/opencourseware/mathematics-2/ipython-lecture-notes/)\n\n介绍:麻省理工Gilbert Strang线性代数课程笔记,Gilbert Strang《Linear Algebra》课程主页[视频+讲义](http://ocw.mit.edu/courses/mathematics/18-06sc-linear-algebra-fall-2011/index.htm).\n\n* [《Canova: A Vectorization Lib for ML》](http://deeplearning4j.org/canova.html)\n\n介绍:面向机器学习/深度学习的数据向量化工具Canova,[github](https://github.com/deeplearning4j/Canova), 支持CSV文件、MNIST数据、TF-IDF/Bag of Words/word2vec文本向量化.\n\n* [《DZone Refcardz: Distributed Machine Learning with Apache Mahout》](http://java.dzone.com/articles/dzone-refcardz-distributed)\n\n介绍:快速入门：基于Apache Mahout的分布式机器学习.\n\n* [《Learning scikit-learn: Machine Learning in Python》](http://nbviewer.ipython.org/github/gmonce/scikit-learn-book/tree/master/)\n\n介绍:基于scikit-learn讲解了一些机器学习技术，如SVM，NB，PCA，DT，以及特征工程、特征选择和模型选择问题.\n\n* [《Lightning fast Machine Learning with Spark》](https://speakerdeck.com/nivdul/lightning-fast-machine-learning-with-spark)\n\n介绍:基于Spark的高效机器学习,[视频地址](https://www.parleys.com/tutorial/lightning-fast-machine-learning-spark).\n\n* [《How we’re using machine learning to fight shell selling》](http://blog.wepay.com/how-were-using-machine-learning-to-fight-shell-selling/)\n\n介绍:WePay用机器学习对抗信用卡\"shell selling\"诈骗.\n\n* [《Data Scientists Thoughts that Inspired Me》](http://www.datasciencecentral.com/profiles/blog/show?id=6448529:BlogPost:273276)\n\n介绍:16位数据科学家语录精选.\n\n* [《Deep learning applications and challenges in big data analytics》](http://www.journalofbigdata.com/content/2/1/1)\n\n介绍:深度学习在大数据分析领域的应用和挑战.\n\n* [《Free book:Machine Learning,Mathematics》](http://resrc.io/list/10/list-of-free-programming-books/#machine-learning)\n\n介绍:免费的机器学习与数学书籍,除此之外还有其他的[免费编程书籍](https://github.com/vhf/resrc),编程语言,设计,操作系统等.\n\n* [《Object detection via a multi-region & semantic segmentation-aware CNN model》](http://arxiv.org/pdf/1505.01749.pdf)\n\n介绍:一篇关于CNN模型对象识别Paper.\n\n* [《A Statistical View of Deep Learning (V): Generalisation and Regularisation》](http://blog.shakirm.com/2015/05/a-statistical-view-of-deep-learning-v-generalisation-and-regularisation/)\n\n介绍:深度学习的统计分析V:泛化和正则化.\n\n* [《Highway Networks》](http://arxiv.org/abs/1505.00387)\n\n介绍:用SGD能高效完成训练的大规模(多层)深度网络HN.\n\n* [《What I Read For Deep-Learning》](http://www.erogol.com/what-i-read-for-deep-learning/)\n\n介绍:深度学习解读文章.\n\n* [《An Introduction to Recommendation Engines》](http://dataconomy.com/an-introduction-to-recommendation-engines)\n\n介绍:Coursera上的推荐系统导论（Introduction to Recommender Systems）公开课.\n\n* [《Stanford Machine Learning》](http://www.holehouse.org/mlclass/index.html)\n\n介绍:Andrew Ng经典机器学习课程笔记.\n\n* [《ICLR 2015》](http://yaroslavvb.blogspot.de/2015/05/iclr-2015_12.html)\n\n介绍:ICLR 2015见闻录,[博客](http://yaroslavvb.blogspot.de/)的其他机器学习文章也不错.\n\n* [《Stanford Machine Learning》](http://www.cripac.ia.ac.cn/People/sw/Xu2015PSR.pdf)\n\n介绍:推荐系统\"个性化语义排序\"模型.\n\n* [《The More Excited We Are, The Shorter We Tweet》](http://senseable.mit.edu/tweetbursts/)\n\n介绍:激情时分更惜字——MIT的最新Twitter研究结果.\n\n* [《苏州大学人类语言技术研究论文主页》](http://hlt.suda.edu.cn/paper.html)\n\n介绍:苏州大学人类语言技术研究相关论文.\n\n* [《Neural Turing Machines implementation》](http://arxiv.org/abs/1505.00387)\n\n介绍:实现神经图灵机(NTM),[项目地址](https://github.com/fumin/ntm),此外推荐相关神经图灵机[算法](http://www.i-programmer.info/news/105-artificial-intelligence/7923-neural-turing-machines-learn-their-algorithms.html).\n\n* [《Computer Vision - CSE 559A, Spring 2015》](http://www.cse.wustl.edu/~furukawa/cse559a/2015_spring/)\n\n介绍:华盛顿大学的机器视觉(2015),参考资料[Computer Vision: Algorithms and Applications](http://szeliski.org/Book/).\n\n* [《Mining of Massive Datasets》](http://www.mmds.org/)\n\n介绍:\"Mining of Massive Datasets\"发布第二版,Jure Leskovec, Anand Rajaraman, Jeff Ullman 新版增加Jure Leskovec作为合作作者，新增社交网络图数据挖掘、降维和大规模机器学习三章,[电子版](http://pan.baidu.com/s/1GvtpG)依旧免费.\n\n* [《Learning Deep Learning》](http://rt.dgyblog.com/ref/ref-learning-deep-learning.html)\n\n介绍:一个深度学习资源页,资料很丰富.\n\n* [《Learning Deep Learning》](http://vdisk.weibo.com/s/ayG13we2ler9b)\n\n介绍:免费电子书\"Learning Deep Learning\".\n\n* [《Tutorial: Machine Learning for Astronomy with Scikit-learn》](http://www.astroml.org/sklearn_tutorial/index.html)\n\n介绍:Machine Learning for Astronomy with scikit-learn.\n\n* [《An Introduction to Random Forests for Beginners》](http://info.salford-systems.com/an-introduction-to-random-forests-for-beginners)\n\n介绍:免费电子书\"随机森林入门指南\".\n\n* [《Top 10 data mining algorithms in plain English》](http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-english/)\n\n介绍:白话数据挖掘十大算法.\n\n* [《An Inside Look at the Components of a Recommendation Engine》](https://www.mapr.com/blog/inside-look-at-components-of-recommendation-engine#.VVmZ5vmqqko)\n\n介绍:基于Mahout和Elasticsearch的推荐系统,[国内译版](http://www.csdn.net/article/2015-05-14/2824676).\n\n* [《Advances in Extreme Learning Machines》](https://aaltodoc.aalto.fi/bitstream/handle/123456789/15585/isbn9789526061498.pdf)\n\n介绍:博士学位论文:ELM研究进展.\n\n* [《10-minute tour of pandas》](https://vimeo.com/59324550)\n\n介绍:Pandas十分钟速览,[ipn](http://nbviewer.ipython.org/urls/gist.github.com/wesm/4757075/raw/a72d3450ad4924d0e74fb57c9f62d1d895ea4574/PandasTour.ipynb).\n\n* [《Data doesn't grow in tables: harvesting journalistic insight from documents》](http://pudo.org/blog/2015/05/15/document-mining.html)\n\n介绍:面向数据新闻的文本挖掘.\n\n* [《Time-lapse Mining from Internet Photos》](http://grail.cs.washington.edu/projects/timelapse/)\n\n介绍:用网络图片合成延时视频(SIGGRAPH 2015).\n\n* [《The Curse of Dimensionality in classification》](http://www.visiondummy.com/2014/04/curse-dimensionality-affect-classification/)\n\n介绍:分类系统的维数灾难.\n\n* [《Deep Learning vs Big Data: Who owns what?》](http://www.computervisionblog.com/2015/05/deep-learning-vs-big-data-who-owns-what.html)\n\n介绍:深度学习vs.大数据——从数据到知识：版权的思考,[翻译版](http://www.csdn.net/article/2015-05-19/2824707\n\n* [《A Primer on Predictive Models》](http://www.nature.com/ctg/journal/v5/n1/abs/ctg201319a.html)\n\n介绍:预测模型入门.\n\n* [《Demistifying LSTM Neural Networks》](http://blog.terminal.com/demistifying-long-short-term-memory-lstm-recurrent-neural-networks/)\n\n介绍:深入浅出LSTM.\n\n* [《ICLR 2015》](https://www.youtube.com/playlist?list=PLhiWXaTdsWB8PnrVZquVyqlRFWXM4ijYz)\n\n介绍:2015年ICLR会议[视频](http://pan.baidu.com/s/1bnbbRyR)与[讲义](http://www.iclr.cc/doku.php?id=iclr2015:main).\n\n* [《On Visualizing Data Well》](http://dataremixed.com/2015/05/on-visualizing-data-well/)\n\n介绍:Ben Jones的数据可视化建议.\n\n* [《Decoding Dimensionality Reduction, PCA and SVD》](http://bigdata-madesimple.com/decoding-dimensionality-reduction-pca-and-svd/)\n\n介绍:解读数据降维/PCA/SVD.\n\n* [《Supervised learning superstitions cheat sheet》](http://ryancompton.net/assets/ml_cheat_sheet/supervised_learning.html)\n\n介绍:IPN:监督学习方法示例/对比参考表,覆盖logistic回归, 决策树, SVM, KNN, Naive Bayes等方法.\n\n* [《DopeLearning: A Computational Approach to Rap Lyrics Generation》](http://arxiv.org/abs/1505.04771)\n\n介绍:基于RankSVM和DNN自动(重组)生成Rap歌词.\n\n* [《An Introduction to Random Indexing》](https://www.sics.se/~mange/papers/RI_intro.pdf)\n\n介绍:随机索引RI词空间模型专题.\n\n* [《VDiscover》](http://www.vdiscover.org/)\n\n介绍:基于机器学习的漏洞检测工具VDiscover.\n\n* [《Minerva》](https://github.com/dmlc/minerva)\n\n介绍:深度学习系统minerva。拥有python编程接口。多GPU几乎达到线性加速。在4块GPU上能在4天内将GoogLeNet训练到68.7%的top-1以及89.0%的top-5准确率。和同为dmlc项目的cxxnet相比，采用动态数据流引擎，提供更多灵活性。未来将和cxxnet一起整合为mxnet项目，互取优势.\n\n* [《CVPR 2015 paper》](http://www.cv-foundation.org/openaccess/CVPR2015.py)\n\n介绍:2015年国际计算机视觉与模式识别会议paper.\n\n* [《What are the advantages of different classification algorithms?》](http://www.quora.com/What-are-the-advantages-of-different-classification-algorithms/answer/Xavier-Amatriain)\n\n介绍:Netflix工程总监眼中的分类算法：深度学习优先级最低,[中文版](http://www.csdn.net/article/2015-05-24/2824758).\n\n* [《Results for Microsoft COCO Image Captioning Challenge》](https://www.codalab.org/competitions/3221#results)\n\n介绍:Codalab图像标注竞赛排行+各家论文,Reddit上flukeskywalker整理了各家技术[相关论文](http://www.reddit.com/r/MachineLearning/comments/376b28/comparison_of_official_test_scores_of_current/).\n\n* [《Caffe con Troll: Shallow Ideas to Speed Up Deep Learning》](http://arxiv.org/abs/1504.04343)\n\n介绍:基于Caffe的加速深度学习系统CcT.\n\n* [《Low precision storage for deep learning》](http://arxiv.org/abs/1412.7024)\n\n介绍:深度学习(模型)低精度(训练与)存储.\n\n* [《Model-Based Machine Learning (Early Access)》](http://www.mbmlbook.com/index.html)\n\n介绍:新书预览:模型机器学习.\n\n* [《Regret Analysis of Stochastic and Nonstochastic Multi-armed Bandit Problems》](http://www.princeton.edu/~sbubeck/SurveyBCB12.pdf)\n\n介绍:免费电子书多臂老虎机,此外推荐[Introduction to Bandits: Algorithms and Theory](https://sites.google.com/site/banditstutorial/).\n\n* [《Kaggle R Tutorial on Machine Learing》](https://www.datacamp.com/courses/kaggle-tutorial-on-machine-learing-the-sinking-of-the-titanic)\n\n介绍:基于Kaggle's Titanic Competition的交互式R机器学习教程,介绍[《Interactive R Tutorial: Machine Learning for the Titanic Competition》](http://blog.kaggle.com/2015/05/27/interactive-r-tutorial-machine-learning-for-the-titanic-competition/).\n\n* [《Deep Learning（深度学习）学习笔记整理系列》](http://suanfazu.com/t/deep-learning/9401)\n\n介绍:Deep Learning（深度学习）学习笔记整理系列.\n\n* [《Introduction to Neural Machine Translation with GPUs 》](http://devblogs.nvidia.com/parallelforall/introduction-neural-machine-translation-with-gpus/)\n\n介绍:神经(感知)机器翻译介绍.\n\n* [《Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning》](https://www.youtube.com/watch?v=n1ViNeWhC24&hd=1)\n\n介绍:Andrew Ng关于深度学习/自学习/无监督特征学习的报告,[国内云](http://pan.baidu.com/s/1jG8DUN8).\n\n* [《Recurrent Neural Network Training with Dark Knowledge Transfer》](http://arxiv.org/abs/1505.04630)\n\n介绍:论文:通过潜在知识迁移训练RNN.\n\n* [《Show Me The Money》](https://github.com/chrischris292/ShowMeTheMoney)\n\n介绍:面向金融数据的情感分析工具.\n\n* [《pyLDAvis》](https://github.com/bmabey/pyLDAvis)\n\n介绍:(Python)主题模型交互可视化库pyLDAvis.\n\n* [《Logistic Regression and Gradient Descent》](http://nbviewer.ipython.org/github/tfolkman/learningwithdata/blob/master/Logistic%20Gradient%20Descent.ipynb)\n\n介绍:Logistic回归与优化实例教程.\n\n* [《贾扬清微信讲座记录》](http://pan.baidu.com/s/1dDGVL53)\n\n介绍:贾扬清（谷歌大脑科学家、caffe缔造者）微信讲座记录.\n\n* [《sketch》](https://github.com/udibr/sketch)\n\n介绍:Theano/Blocks实现RNN手写字符串生成sketch.\n\n* [《Web Scale Document Clustering: Clustering 733 Million Web Pages》](http://chris.de-vries.id.au/2015/05/web-scale-document-clustering.html)\n\n介绍:基于TopSig的海量(7亿+)网页聚类.\n\n* [《NAACL 2015 Proceedings on ACL Anthology》](http://aclweb.org/anthology/N/N15/)\n\n介绍:NAACL 2015 论文papers.\n\n* [《Stock Forecasting With Machine Learning - Seven Possible Errors》](http://www.anlytcs.com/2015/05/stock-forecasting-with-machine-learning.html)\n\n介绍:机器学习预测股市的七个问题.\n\n* [《Are there any good resources for learning about neural networks?》](http://www.reddit.com/r/MachineLearning/comments/378but/are_there_any_good_resources_for_learning_about/)\n\n介绍:神经网络学习资料推荐.\n\n* [《A Critical Review of Recurrent Neural Networks for Sequence Learning》](http://arxiv.org/abs/1506.00019v1)\n\n介绍:面向序列学习的RNN综述.\n\n* [《Handling and Processing Strings in R》](http://gastonsanchez.com/Handling_and_Processing_Strings_in_R.pdf)\n\n介绍:R文本处理手册.\n\n* [《Must-watch videos about Python》](https://github.com/s16h/py-must-watch)\n\n介绍:“必看”的Python视频集锦.\n\n* [《The Google Stack》](http://malteschwarzkopf.de/research/assets/google-stack.pdf)\n\n介绍:Google(基础结构)栈.\n\n* [《Randomized Algorithms for Matrices and Data》](http://cs.stanford.edu/people/mmahoney/f13-stat260-cs294/)\n\n介绍:矩阵和数据的随机算法(UC Berkeley 2013).\n\n* [《Intermediate R》](https://www.datacamp.com/courses/intermediate-r)\n\n介绍:DataCamp中级R语言教程.\n\n* [《Topology Without Tears》](http://www.topologywithouttears.net/)\n\n介绍:免费电子书:轻松掌握拓扑学,[中文版](http://www.topologywithouttears.net/topbookchinese.pdf).\n\n* [《Information Theory, Pattern Recognition, and Neural Networks》](http://www.inference.phy.cam.ac.uk/itprnn_lectures/)\n\n介绍:[Book](http://www.inference.phy.cam.ac.uk/itprnn/book.pdf),[video](https://www.youtube.com/user/jakobfoerster/videos).\n\n* [《Scikit-learn》](www.github.com/scikit-learn/scikit-learn)\n\n介绍:Scikit-learn 是基于Scipy为机器学习建造的的一个Python模块，他的特色就是多样化的分类，回归和聚类的算法包括支持向量机，逻辑回归，朴素贝叶斯分类器，随机森林，Gradient Boosting，聚类算法和DBSCAN。而且也设计出了Python numerical和scientific libraries Numpy and Scipy\n\n* [《Pylearn2》](www.github.com/lisa-lab/pylearn2)\n\n介绍:Pylearn是一个让机器学习研究简单化的基于Theano的库程序。\n\n* [《NuPIC》](www.github.com/numenta/nupic)\n\n介绍:NuPIC是一个以HTM学习算法为工具的机器智能平台。HTM是皮层的精确计算方法。HTM的核心是基于时间的持续学习算法和储存和撤销的时空模式。NuPIC适合于各种各样的问题,尤其是检测异常和预测的流数据来源。\n\n* [《Nilearn》](www.github.com/nilearn/nilearn)\n\n介绍:Nilearn 是一个能够快速统计学习神经影像数据的Python模块。它利用Python语言中的scikit-learn 工具箱和一些进行预测建模，分类，解码，连通性分析的应用程序来进行多元的统计。\n\n* [《PyBrain》](www.github.com/pybrain/pybrain)\n\n介绍:Pybrain是基于Python语言强化学习，人工智能，神经网络库的简称。 它的目标是提供灵活、容易使用并且强大的机器学习算法和进行各种各样的预定义的环境中测试来比较你的算法。\n\n* [《Pattern》](www.github.com/clips/pattern)\n\n介绍:Pattern 是Python语言下的一个网络挖掘模块。它为数据挖掘，自然语言处理，网络分析和机器学习提供工具。它支持向量空间模型、聚类、支持向量机和感知机并且用KNN分类法进行分类。\n\n* [《Fuel》](www.github.com/mila-udem/fuel)\n\n介绍:Fuel为你的机器学习模型提供数据。他有一个共享如MNIST, CIFAR-10 (图片数据集), Google’s One Billion Words (文字)这类数据集的接口。你使用他来通过很多种的方式来替代自己的数据。\n\n* [《Bob》](www.github.com/idiap/bob)\n\n介绍:Bob是一个免费的信号处理和机器学习的工具。它的工具箱是用Python和C++语言共同编写的，它的设计目的是变得更加高效并且减少开发时间，它是由处理图像工具,音频和视频处理、机器学习和模式识别的大量软件包构成的。\n\n* [《Skdata》](www.github.com/jaberg/skdata)\n\n介绍:Skdata是机器学习和统计的数据集的库程序。这个模块对于玩具问题，流行的计算机视觉和自然语言的数据集提供标准的Python语言的使用。\n\n* [《MILK》](www.github.com/luispedro/milk)\n\n介绍:MILK是Python语言下的机器学习工具包。它主要是在很多可得到的分类比如SVMS,K-NN,随机森林，决策树中使用监督分类法。 它还执行特征选择。 这些分类器在许多方面相结合,可以形成不同的例如无监督学习、密切关系金传播和由MILK支持的K-means聚类等分类系统。\n\n* [《IEPY》](www.github.com/machinalis/iepy)\n\n介绍:IEPY是一个专注于关系抽取的开源性信息抽取工具。它主要针对的是需要对大型数据集进行信息提取的用户和想要尝试新的算法的科学家。\n\n* [《Quepy》](www.github.com/machinalis/quepy)\n\n介绍:Quepy是通过改变自然语言问题从而在数据库查询语言中进行查询的一个Python框架。他可以简单的被定义为在自然语言和数据库查询中不同类型的问题。所以，你不用编码就可以建立你自己的一个用自然语言进入你的数据库的系统。现在Quepy提供对于Sparql和MQL查询语言的支持。并且计划将它延伸到其他的数据库查询语言。\n\n* [《Hebel》](www.github.com/hannes-brt/hebel)\n\n介绍:Hebel是在Python语言中对于神经网络的深度学习的一个库程序，它使用的是通过PyCUDA来进行GPU和CUDA的加速。它是最重要的神经网络模型的类型的工具而且能提供一些不同的活动函数的激活功能，例如动力，涅斯捷罗夫动力，信号丢失和停止法。\n\n* [《mlxtend》](www.github.com/rasbt/mlxtend)\n\n介绍:它是一个由有用的工具和日常数据科学任务的扩展组成的一个库程序。\n\n* [《nolearn》](www.github.com/dnouri/nolearn)\n\n介绍:这个程序包容纳了大量能对你完成机器学习任务有帮助的实用程序模块。其中大量的模块和scikit-learn一起工作，其它的通常更有用。\n\n* [《Ramp》](www.github.com/kvh/ramp)\n\n介绍:Ramp是一个在Python语言下制定机器学习中加快原型设计的解决方案的库程序。他是一个轻型的pandas-based机器学习中可插入的框架，它现存的Python语言下的机器学习和统计工具（比如scikit-learn,rpy2等）Ramp提供了一个简单的声明性语法探索功能从而能够快速有效地实施算法和转换。\n\n* [《Feature Forge》](www.github.com/machinalis/featureforge)\n\n介绍:这一系列工具通过与scikit-learn兼容的API，来创建和测试机器学习功能。这个库程序提供了一组工具，它会让你在许多机器学习程序使用中很受用。当你使用scikit-learn这个工具时，你会感觉到受到了很大的帮助。（虽然这只能在你有不同的算法时起作用。）\n\n* [《REP》](www.github.com/yandex/rep)\n\n介绍:REP是以一种和谐、可再生的方式为指挥数据移动驱动所提供的一种环境。它有一个统一的分类器包装来提供各种各样的操作，例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一个群体以平行的方式训练分类器。同时它也提供了一个交互式的情节。\n\n* [《Python 学习机器样品》](www.github.com/awslabs/machine-learning-samples)\n\n介绍:用亚马逊的机器学习建造的简单软件收集。\n\n* [《Python-ELM》](www.github.com/dclambert/Python-ELM)\n\n介绍:这是一个在Python语言下基于scikit-learn的极端学习机器的实现。\n\n* [《Dimension Reduction》](http://forum.memect.com/thread/dimension-reduction/)\n\n介绍:电子书降维方法,此外还推荐[Dimensionality Reduction A Short Tutorial](http://www.stat.washington.edu/courses/stat539/spring14/Resources/tutorial_nonlin-dim-red.pdf)、[Matlab Toolbox for Dimensionality Reduction](http://lvdmaaten.github.io/drtoolbox/)、[Unsupervised Kernel Dimension Reduction](http://www.cs.berkeley.edu/~jordan/papers/wang-sha-jordan-nips11.pdf)\n\n* [《Datasets Used For Benchmarking Deep Learning Algorithms》](http://deeplearning.net/datasets/)\n\n介绍:deeplearning.net整理的深度学习数据集列表.\n\n* [《Golang Natural Language Processing》](https://github.com/advancedlogic/go-freeling)\n\n介绍:Go语言编写的自然语言处理工具.\n\n* [《Rehabilitation of Count-based Models for Word Vector Representations》](http://arxiv.org/abs/1412.4930)\n\n介绍:词频模型对词向量的反击,参考[Improving Distributional Similarity with Lessons Learned from Word Embeddings ](https://levyomer.files.wordpress.com/2015/03/improving-distributional-similarity-tacl-2015.pdf)。\n\n* [《Three Aspects of Predictive Modeling》](http://static1.squarespace.com/static/51156277e4b0b8b2ffe11c00/t/55344152e4b0ff30bb9ec163/1429487954122/ASA_Kuhn.pdf)\n\n介绍:预测模型的三个方面.\n\n* [《CS224d: Deep Learning for Natural Language Processing》](http://cs224d.stanford.edu/)\n\n介绍:斯坦福大学深度学习与自然语言处理课程,部分课程笔记[词向量](http://www.52nlp.cn/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%8E%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E7%AC%AC%E4%BA%8C%E8%AE%B2%E8%AF%8D%E5%90%91%E9%87%8F)、[引言](http://www.52nlp.cn/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%8E%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E7%AC%AC%E4%B8%80%E8%AE%B2%E5%BC%95%E8%A8%80)\n\n* [《Google Computer Vision research at CVPR 2015》](http://googleresearch.blogspot.jp/2015/06/google-computer-vision-research-at-cvpr.html)\n\n介绍:CVPR2015上Google的CV研究列表.\n\n* [《Using Deep Learning to Find Basketball Highlights》](http://public.hudl.com/bits/archives/2015/06/05/highlights/)\n\n介绍:利用(Metamind)深度学习自动发现篮球赛精彩片段.\n\n* [《Learning Deep Features for Discriminative Localization》](http://arxiv.org/abs/1512.04150)\n\n介绍:对本土化特征学习的分析\n"
  },
  {
    "path": "dl2.md",
    "content": "## 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)\n\n#### 注:机器学习资料[篇目一](https://github.com/ty4z2008/Qix/blob/master/dl.md)共500条,[篇目二](https://github.com/ty4z2008/Qix/blob/master/dl2.md)开始更新\n\n##### 希望转载的朋友，你可以不用联系我．但是**一定要保留原文链接**，因为这个项目还在继续也在不定期更新．希望看到文章的朋友能够学到更多．此外:某些资料在中国访问需要梯子.\n\n\n* [《Image Scaling using Deep Convolutional Neural Networks》](http://engineering.flipboard.com/2015/05/scaling-convnets/)\n\n介绍:使用卷积神经网络的图像缩放.\n\n* [《Proceedings of The 32nd International Conference on Machine Learning》](http://jmlr.org/proceedings/papers/v37/)\n\n介绍:ICML2015 论文集,优化4个+稀疏优化1个；强化学习4个，深度学习3个+深度学习计算1个；贝叶斯非参、高斯过程和学习理论3个；还有计算广告和社会选择.[ICML2015 Sessions](http://icml.cc/2015/?page_id=825).\n\n* [《Image Scaling using Deep Convolutional Neural Networks》](http://engineering.flipboard.com/2015/05/scaling-convnets/)\n\n介绍:使用卷积神经网络的图像缩放.\n\n* [《Microsoft researchers accelerate computer vision accuracy and improve 3D scanning models》](http://blogs.technet.com/b/inside_microsoft_research/archive/2015/06/08/microsoft-researchers-accelerate-computer-vision-accuracy-and-improve-3d-scanning-models.aspx)\n\n介绍:，第28届IEEE计算机视觉与模式识别(CVPR)大会在美国波士顿举行。微软研究员们在大会上展示了比以往更快更准的计算机视觉图像分类新模型，并介绍了如何使用Kinect等传感器实现在动态或低光环境的快速大规模3D扫描技术.\n\n* [《Machine Learning for Humans》](https://github.com/marcotcr/mlforhumans)\n\n介绍:(文本)机器学习可视化分析工具.\n\n* [《A Plethora of Tools for Machine Learning》](http://knowm.org/machine-learning-tools-an-overview/)\n\n介绍:机器学习工具包/库的综述/比较.\n\n* [《The art of visualizing visualizations: a best practice guide》](http://sapblog.be/en/the-art-of-visualizing-visualizations-a-best-practice-guide/)\n\n介绍:数据可视化最佳实践指南.\n\n* [《MIT Machine Learning for Big Data and Text Processing Class Notes - Day 1》](http://blog.adnanmasood.com/2015/06/08/mit-machine-learning-for-big-data-and-text-processing-class-notes-day-1/)\n\n介绍:[Day 1](http://blog.adnanmasood.com/2015/06/08/mit-machine-learning-for-big-data-and-text-processing-class-notes-day-1/)、[Day 2](http://blog.adnanmasood.com/2015/06/09/mit-machine-learning-for-big-data-and-text-processing-class-notes-day-2/)、[Day 3](http://blog.adnanmasood.com/2015/06/11/mit-machine-learning-for-big-data-and-text-processing-class-notes-day-3/)、[Day 4](http://blog.adnanmasood.com/2015/06/12/mit-machine-learning-for-big-data-and-text-processing-class-notes-day-4/)、[Day 5](http://blog.adnanmasood.com/2015/06/12/mit-machine-learning-for-big-data-and-text-processing-class-notes-day-5/).\n\n* [《Getting “deep” about “deep learning”》](http://whatsnext.nuance.com/in-the-labs/what-is-deep-machine-learning/)\n\n介绍:深度学习之“深”——DNN的隐喻分析.\n\n* [《Mixture Density Networks》](http://blog.otoro.net/2015/06/14/mixture-density-networks/)\n\n介绍:混合密度网络.\n\n* [《Interview Questions for Data Scientist Positions》](https://medium.com/@D33B/interview-questions-for-data-scientist-positions-5ad3c5d5b8bd)\n\n介绍:数据科学家职位面试题.\n\n* [《Accurately Measuring Model Prediction Error》](http://scott.fortmann-roe.com/docs/MeasuringError.html)\n\n介绍:准确评估模型预测误差.\n\n* [《Continually updated Data Science Python Notebooks》](https://github.com/donnemartin/data-science-ipython-notebooks)\n\n介绍:Continually updated Data Science Python Notebooks.\n\n* [《How to share data with a statistician》](https://github.com/jtleek/datasharing)\n\n介绍:How to share data with a statistician.\n\n* [《The Eyescream Project NeuralNets dreaming natural images》](http://soumith.ch/eyescream/)\n\n介绍:来自Facebook的图像自动生成.\n\n* [《How to share data with a statistician》](https://github.com/jtleek/datasharing)\n\n介绍:How to share data with a statistician.\n\n* [《A Neural Conversational Model》](http://arxiv.org/abs/1506.05869)\n\n介绍:(Google)神经(感知)会话模型.\n\n* [《The 50 Best Masters in Data Science》](http://www.datasciencecentral.com/profiles/blogs/the-50-best-masters-in-data-science)\n\n介绍:The 50 Best Masters in Data Science.\n\n* [《NLP常用信息资源》](http://forum.memect.com/thread/nlp%E5%B8%B8%E7%94%A8%E4%BF%A1%E6%81%AF%E8%B5%84%E6%BA%90/)\n\n介绍:NLP常用信息资源.\n\n* [《Conditional Random Fields as Recurrent Neural Networks》](http://www.robots.ox.ac.uk/~szheng/papers/CRFasRNN.pdf)\n\n介绍:语义图像分割的实况[演示](http://www.robots.ox.ac.uk/~szheng/crfasrnndemo),通过深度学习技术和概率图模型的语义图像分割.\n\n* [《Fully Convolutional Networks for Semantic Segmentation》](http://www.cs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf)\n\n介绍:Caffe模型/代码:面向图像语义分割的全卷积网络,[模型代码](https://github.com/BVLC/caffe/wiki/Model-Zoo#fcn).\n\n* [《Growing Pains for Deep Learning》](http://cacm.acm.org/news/188737-growing-pains-for-deep-learning/fulltext)\n\n介绍:深度学习——成长的烦恼.\n\n* [《Clustering Text Data Streams – A Tree based Approach with Ternary Function and Ternary Feature Vector 》](http://www.sciencedirect.com/science/article/pii/S1877050914005274)\n\n介绍:基于三元树方法的文本流聚类.\n\n* [《Foundations and Advances in Data Mining》](http://cs.ucla.edu/~wwc/course/cs245a/mining%20book.pdf)\n\n介绍:Free Ebook:数据挖掘基础及最新进展.\n\n* [《The Deep Learning Revolution: Rethinking Machine Learning Pipelines》](http://www.infoq.com/presentations/deep-learning)\n\n介绍:深度学习革命.\n\n* [《The Definitive Guide to Do Data Science for Good》](http://blog.datalook.io/definitive-guide-data-science-good/)\n\n介绍:数据科学(实践)权威指南.\n\n* [《Microsoft Academic Graph》](http://research.microsoft.com/en-us/projects/mag/)\n\n介绍:37G的微软学术图谱数据集.\n\n* [《Challenges and Opportunities Of Machine Learning In Production》](https://www.youtube.com/watch?v=UEwDwTkWwdc&hd=1)\n\n介绍:生产环境(产品级)机器学习的机遇与挑战.\n\n* [《Neural Nets for Newbies》](https://www.youtube.com/watch?v=Cu6A96TUy_o)\n\n介绍:神经网络入门.\n\n* [《A Nearly-Linear Time Framework for Graph-Structured Sparsity》](http://jmlr.org/proceedings/papers/v37/hegde15.pdf)\n\n介绍:来自麻省理工的结构化稀疏论文.\n\n* [《Optimal and Adaptive Algorithms for Online Boosting》](http://jmlr.org/proceedings/papers/v37/beygelzimer15.pdf)\n\n介绍:来自雅虎的机器学习小组关于在线Boosting的论文 .\n\n* [《Top 20 Python Machine Learning Open Source Projects》](http://www.kdnuggets.com/2015/06/top-20-python-machine-learning-open-source-projects.html)\n\n介绍:20个最热门的开源(Python)机器学习项目.\n\n* [《The Parallel C++ Statistical Library for Bayesian Inference: QUESO》](http://arxiv.org/abs/1507.00398)\n\n介绍:C++并行贝叶斯推理统计库QUESO,[github code](http://libqueso.com/).\n\n* [《《Deep learning》Yann LeCun, Yoshua Bengio, Geoffrey Hinton (2015) 》](http://www.nature.com/nature/journal/v521/n7553/full/nature14539.html)\n\n介绍:Nature:LeCun/Bengio/Hinton的最新文章《深度学习》,Jürgen Schmidhuber的最新评论文章[《Critique of Paper by \"Deep Learning Conspiracy\" (Nature 521 p 436)》](http://people.idsia.ch/~juergen/deep-learning-conspiracy.html).\n\n* [《Palladium》](https://github.com/ottogroup/palladium)\n\n介绍:基于Scikit-Learn的预测分析服务框架Palladium.\n\n* [《Advances in Structured Prediction》](http://hunch.net/~l2s/merged.pdf)\n\n介绍:John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片.\n\n* [《100 open source Big Data architecture papers for data professionals》](https://www.linkedin.com/pulse/100-open-source-big-data-architecture-papers-anil-madan)\n\n介绍:读完这100篇论文 就能成大数据高手,[国内翻译](http://www.csdn.net/article/2015-07-07/2825148/1).\n\n* [《Social Media & Text Analytics》](http://socialmedia-class.org/syllabus.html)\n\n介绍:NLP课程《社交媒体与文本分析》精选阅读列表.\n\n* [《Machine Learning for Developers》](http://xyclade.github.io/MachineLearning/)\n\n介绍:写给开发者的机器学习指南.\n\n* [《Hot news detection using Wikipedia》](http://hameddaily.blogspot.com/2015/06/hot-news-detection-using-wikipedia_29.html)\n\n介绍:基于维基百科的热点新闻发现.\n\n* [《Harvard Intelligent Probabilistic Systems Group》](https://github.com/HIPS)\n\n介绍:(Harvard)HIPS将发布可扩展/自动调参贝叶斯推理神经网络.\n\n* [《An Empirical Exploration of Recurrent Network Architectures》](http://jmlr.org/proceedings/papers/v37/jozefowicz15.html)\n\n介绍:面向上下文感知查询建议的层次递归编解码器.\n\n* [《Efficient Training of LDA on a GPU by Mean-for-Mode Estimation》](http://jmlr.org/proceedings/papers/v37/tristan15.html)\n\n介绍:GPU上基于Mean-for-Mode估计的高效LDA训练.\n\n* [《From the Lab to the Factory: Building a Production Machine Learning Infrastructure》](https://www.youtube.com/watch?v=v-91JycaKjc&hd=1)\n\n介绍:从实验室到工厂——构建机器学习生产架构.\n\n* [《6 Useful Databases to Dig for Data (and 100 more)》](http://piktochart.com/6-useful-databases-to-dig-for-data/)\n\n介绍:适合做数据挖掘的6个经典数据集(及另外100个列表).\n\n* [《Deep Networks for Computer Vision at Google – ILSVRC2014》](http://www.computervisiontalks.com/deep-networks-for-computer-vision-at-google/)\n\n介绍:Google面向机器视觉的深度学习.\n\n* [《How to choose a machine learning API to build predictive apps》](https://medium.com/@louisdorard/developer-considerations-for-choosing-a-machine-learning-api-20e2de15eb3a)\n\n介绍:构建预测类应用时如何选择机器学习API.\n\n* [《Exploring the shapes of stories using Python and sentiment APIs》](https://indico.io/blog/plotlines/)\n\n介绍:Python+情感分析API实现故事情节(曲线)分析.\n\n* [《Movie selection using R》](http://melodywolk.com/2015/07/21/movie-selection-using-r/)\n\n介绍:(R)基于Twitter/情感分析的口碑电影推荐,此外推荐[分类算法的实证比较分析](http://freakonometrics.hypotheses.org/20002).\n\n* [《A Tutorial on Graph-based Semi-Supervised Learning Algorithms for NLP》](http://graph-ssl.wdfiles.com/local--files/blog%3A_start/graph_ssl_acl12_tutorial_slides_final.pdf)\n\n介绍:CMU(ACL 2012)(500+页)面向NLP基于图的半监督学习算法.\n\n* [《Arbitrariness of peer review: A Bayesian analysis of the NIPS experiment》](http://arxiv.org/abs/1507.06411)\n\n介绍:从贝叶斯分析NIPS，看同行评审的意义.\n\n* [《Basics of Computational Reinforcement Learning》](http://videolectures.net/rldm2015_littman_computational_reinforcement/)\n\n介绍:(RLDM 2015)计算强化学习入门.\n\n* [《Deep Reinforcement Learning》](http://videolectures.net/rldm2015_silver_reinforcement_learning/)\n\n介绍:David Silver的深度强化学习教程.\n\n* [《On Explainability of Deep Neural Networks》](http://blog.adnanmasood.com/2015/07/31/on-explainability-of-deep-neural-networks/)\n\n介绍:深度神经网络的可解释性.\n\n* [《The Essential Spark Cheat Sheet》](http://info.mapr.com/rs/mapr/images/rd204-010d-spark_0.pdf)\n\n介绍:Spark快速入门.\n\n* [《Machine Learning for Sports and Real Time Predictions》](http://www.thetalkingmachines.com/blog/2015/7/30/machine-learning-for-sports-and-real-time-predictions)\n\n介绍:TalkingMachines:面向体育/政治和实时预测的机器学习.\n\n* [《CS224W: Social and Information Network Analysis Autumn 2014》](http://web.stanford.edu/class/cs224w/index.html)\n\n介绍:Stanford社交网络与信息网络分析课程[资料](http://web.stanford.edu/class/cs224w/handouts.html)+[课设](http://web.stanford.edu/class/cs224w/projects.html)+[数据](http://web.stanford.edu/class/cs224w/resources.html).\n\n* [《RL Course by David Silver》](https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa)\n\n介绍:David Silver(DeeMind)的强化学习课程,[slide](http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html).\n\n* [《Faster deep learning with GPUs and Theano》](http://blog.dominodatalab.com/gpu-computing-and-deep-learning/)\n\n介绍:基于Theano/GPU的高效深度学习.\n\n* [《Introduction to R Programming》](https://www.edx.org/course/introduction-r-programming-microsoft-dat204x)\n\n介绍:来自微软的<R编程入门>.\n\n* [《Golang:Web Server For Performing Sentiment Analysis》](https://github.com/cdipaolo/sentiment-server)\n\n介绍:(Go)情感分析API服务Sentiment Server.\n\n* [《A Beginner’s Guide to Restricted Boltzmann Machines》](http://deeplearning4j.org/restrictedboltzmannmachine.html)\n\n介绍:受限波尔兹曼机初学者指南.\n\n* [《KDD2015十年最佳论文》](http://www.kdd.org/kdd2015/program.html)\n\n介绍:[Mining and Summarizing Customer Reviews ](http://www.cs.uic.edu/~liub/publications/kdd04-revSummary.pdf),[Mining High-Speed Data Streams](http://homes.cs.washington.edu/~pedrod/papers/kdd00.pdf),[Optimizing Search Engines using Clickthrough Data](http://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf).\n\n* [《Nvidia Deep Learning Courses》](http://www.hellophp.cn/archives/733)\n\n介绍:Nvidia深度学习课程.\n\n\n* [《Deep Learning Summer School 2015》](https://sites.google.com/site/deeplearningsummerschool/)\n\n介绍:2015年深度学习暑期课程，推荐[讲师主页](http://www.iro.umontreal.ca/~memisevr).\n\n* [《百度深度学习的图像识别进展》](http://www.cvrobot.net/image-recognition-progression-based-on-deep-learning-by-baidu/)\n\n介绍:这是一篇关于百度文章[《基于深度学习的图像识别进展：百度的若干实践》](http://www.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2857471255804)的摘要,建议两篇文章结合起来阅读.\n\n* [《Machine Learning Methods in Video Annotation》](http://rnd.azoft.com/machine-learning-methods-video-annotation/)\n\n介绍:视频标注中的机器学习技术.\n\n* [《Training Recurrent Neural Networks》](http://www.cs.utoronto.ca/~ilya/pubs/ilya_sutskever_phd_thesis.pdf)\n\n介绍:博士论文:(Ilya Sutskever)RNN训练.\n\n* [《On Explainability of Deep Neural Networks》](http://blog.adnanmasood.com/2015/07/31/on-explainability-of-deep-neural-networks/)\n\n介绍:深度神经网络的灰色区域：可解释性问题，[中文版](http://www.csdn.net/article/2015-08-17/2825471).\n\n* [《Machine Learning Libraries in GoLang by Category》](http://www.fodop.com/ar-1002)\n\n介绍:Golang 实现的机器学习库资源汇总.\n\n* [《A Statistical View of Deep Learning》](http://blog.shakirm.com/wp-content/uploads/2015/07/SVDL.pdf)\n\n介绍:深度学习的统计分析.\n\n* [《Deep Learning For NLP - Tips And Techniques》](http://www.researchgate.net/publication/279853751_DEEP_LEARNING_FOR_NLP_-_TIPS_AND_TECHNIQUES)\n\n介绍:面向NLP的深度学习技术与技巧.\n\n* [《CrowdFlower Competition Scripts: Approaching NLP》](http://blog.kaggle.com/2015/08/18/crowdflower-scripts-approaching-nlp/)\n\n介绍:Kaggle's CrowdFlower竞赛NLP代码集锦.\n\n* [《CS224U: Natural Language Understanding》](http://web.stanford.edu/class/cs224u/index.html)\n\n介绍:斯坦福的自然语言理解课程.\n\n* [《Deep Learning and Shallow Learning》](http://freemind.pluskid.org/machine-learning/deep-learning-and-shallow-learning/)\n\n介绍:Deep Learning与Shallow Learning 介绍\n\n* [《A First Encounter with Machine Learning》](http://www.ics.uci.edu/~welling/teaching/ICS273Afall11/IntroMLBook.pdf)\n\n介绍:这是一本机器学习的电子书,作者[Max Welling](http://www.ics.uci.edu/~welling/)先生在机器学习教学上面有着丰富的经验,这本书小但精致.\n\n* [《Click Models for Web Search》](http://clickmodels.weebly.com/uploads/5/2/2/5/52257029/mc2015-clickmodels.pdf)\n\n介绍:由荷兰阿姆斯特丹大学 & 谷歌瑞士著.\n\n* [《Hinton CSC321课程/Deep Learning/Notes on CNN/Python/Theano/CUDA/OpenCV/...》](http://www.cnblogs.com/shouhuxianjian/p/4529235.html)\n\n介绍:介绍个乐于总结和翻译机器学习和计算机视觉类资料的博客,包含的内容：Hinton的CSC321课程的总结；Deep Learning综述；Notes on CNN的总结；python的原理总结；Theano基础知识和练习总结；CUDA原理和编程；OpenCV一些总结.\n\n* [《Which Algorithm Family Can Answer My Question?》](http://blogs.technet.com/b/machinelearning/archive/2015/09/01/which-algorithm-family-can-answer-my-question.aspx)\n\n介绍:针对具体问题(应用场景)如何选择机器学习算法(系列).\n\n* [《Free Data Science Books》](http://www.learndatasci.stfi.re/free-books/)\n\n介绍:数据科学免费书分类集合\n\n* [《Tutorial 4: Deep Learning for Speech Generation and Synthesis》](http://www.superlectures.com/iscslp2014/tutorial-4-deep-learning-for-speech-generation-and-synthesis)\n\n介绍:深度学习在语音合成最新进展有哪些？推荐MSRA的Frank Soong老师关于语音合成的深度学习方法的录像和幻灯片与以及谷歌的LSTM-RNN合成[介绍](http://static.googleusercontent.com/media/research.google.com/en//pubs/archive/42624.pdf),[论文](http://static.googleusercontent.com/media/research.google.com/en//pubs/archive/43893.pdf)\n\n* [《The Art of Data Science》](https://leanpub.com/artofdatascience)\n\n介绍:新书(可免费下载):数据科学的艺术\n\n* [《Pattern Recognition and Machine Learning》](http://research.microsoft.com/en-us/um/people/cmbishop/prml/)\n\n介绍:模式识别与机器学习书籍推荐,本书是微软剑桥研究院大神Bishop所写，算是最为广为认知的机器学习教材之一，内容覆盖全面，难度中上，适合研究生[中文版](https://www.dropbox.com/s/sx95jq7n7zerrjl/PRML_Translation.pdf?dl=0) or [备份](http://pan.baidu.com/s/1hqheD5E)\n\n* [《an introduction to visualizing DATA》](http://piksels.com/wp-content/uploads/2009/01/visualizingdata.pdf)\n\n介绍:数据可视化介绍(23页袖珍小册子)\n\n* [《That’s So Annoying!!!: A Lexical and Frame-Semantic Embedding Based Data Augmentation Approach to Automatic Categorization of Annoying Behaviors using #petpeeve Tweets ∗》](https://www.cs.cmu.edu/~yww/papers/emnlp2015petpeeves.pdf)\n\n介绍:这篇论文荣获EMNLP2015的最佳数据/资源奖优秀奖,[标注的推特数据集](https://www.cs.cmu.edu/~yww/data/petpeeves.zip)\n\n* [《26 Things I Learned in the Deep Learning Summer School》](http://www.marekrei.com/blog/26-things-i-learned-in-the-deep-learning-summer-school/)\n\n介绍:作者在深度学习的思考.\n\n* [《Data-Visualization Tools & Books》](http://keshif.me/demo/VisTools)\n\n介绍:数据可视化常用工具软件资源汇总\n\n* [《Machine Learning and Probabilistic Graphical Models Course》](http://www.cedar.buffalo.edu/~srihari/CSE574/)\n\n介绍:Buffalo大学教授Sargur Srihari的“机器学习和概率图模型”的视频课程\n\n* [《Understanding Machine Learning: From Theory to Algorithms》](http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/index.html)\n\n介绍:耶路撒冷希伯来大学教授Shai Shalev-Shwartz和滑铁卢大学教授Shai Ben-David的新书Understanding Machine Learning: From Theory to Algorithms,此书写的比较偏理论，适合对机器学习理论有兴趣的同学选读\n\n* [《Machine Learning Checklist》](http://machinelearningmastery.com/machine-learning-checklist/)\n\n介绍:机器学习学习清单\n\n* [《NLP界有哪些神级人物？》](http://www.zhihu.com/question/32318281)\n\n介绍:知乎上面的一篇关于NLP界有哪些神级人物？提问。首推Michael Collins \n\n* [《机器学习温和指南》](http://www.csdn.net/article/2015-09-08/2825647)\n\n介绍:机器学习与NLP专家、MonkeyLearn联合创始人&CEO Raúl Garreta面向初学者大体概括使用机器学习过程中的重要概念，应用程序和挑战，旨在让读者能够继续探寻机器学习知识。\n\n* [《Gradient Boosted Regression Trees》](http://nbviewer.ipython.org/github/pprett/pydata-gbrt-tutorial/blob/master/gbrt-tutorial.ipynb)\n\n介绍:(IPN)基于Scikit-Learn的GBRT(Gradient Boost Regression Tree)教程，[slide](http://orbi.ulg.ac.be/bitstream/2268/163521/1/slides.pdf).推荐决策树相关[阅读列表](https://github.com/benedekrozemberczki/awesome-gradient-boosting-papers)\n\n* [《Apache SINGA : Distributed Deep Learning System》](http://www.comp.nus.edu.sg/~dbsystem/singa/)\n\n介绍: 无需做深度学习就能用的分布式深度学习软件.\n\n* [《E-commerce Recommendation with Personalized Promotion》](http://dl.acm.org/citation.cfm?id=2800178)\n\n介绍: 在亚马逊数据和众包Mechanical Turk上，实现了来自彩票和拍卖的机制，以收集用户对产品的乐意购买价格（WTP，willingness-to-pay）训练集。 E-commerce Recommendation with Personalized Promotion [Zhao,RecSys15] 回归模型预测未知WTP，提升卖家利润和消费者满意度\n\n* [《Scalable Machine Learning》](https://www.edx.org/course/scalable-machine-learning-uc-berkeleyx-cs190-1x)\n\n介绍:来自伯克利分校的大规模机器学习.\n\n* [《机器学习资料大汇总》](http://www.52ml.net/star)\n\n介绍:来自52ml的机器学习资料大汇总.\n\n* [《Automatic Summarization》](http://www.cis.upenn.edu/~nenkova/1500000015-Nenkova.pdf)\n\n介绍:这本书的作[者McKeown](http://www.cis.upenn.edu/~nenkova/)是2013年世界首个数据科学院（位于哥伦比亚大学）主任，她亦是ACL、AAAI和ACM Fellow .\n\n* [《Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing》](http://www.emnlp2015.org/proceedings/EMNLP/index.html)\n\n介绍:EMNLP-15文本摘要若干.\n\n* [《Recommender Systems (Machine Learning Summer School 2014 @ CMU)》](http://www.slideshare.net/xamat/recommender-systems-machine-learning-summer-school-2014-cmu)\n\n介绍:来自Netflix的Xavier Amatriain在Summer School 2014 @ CMU上长达4小时的报告，共248页，是对推荐系统发展的一次全面综述，其中还包括Netflix在个性化推荐方面的一些经验介绍.\n\n* [《BigData Stream Mining》](http://www.ecmlpkdd2015.org/sites/default/files/ECMLPKDD2015Slides.pdf)\n\n介绍:(ECML PKDD 2015)大数据流挖掘教程,此外推荐[ECML PKDD 2015 Tutorial列表](http://www.ecmlpkdd2015.org/program/tutorial-list).\n\n* [《Deep learning on Spark with Keras》](https://github.com/maxpumperla/elephas)\n\n介绍:Spark上的[Keras](https://github.com/fchollet/keras)深度学习框架Elephas.\n\n* [《Prof. Surya Ganguli - The statistical physics of deep learning》](https://www.youtube.com/watch?v=7KCWcx-YIRI&hd=1)\n\n介绍:Surya Ganguli深度学习统计物理学.\n\n* [《(系统/算法/机器学习/深度学习/图模型/优化/...)在线视频课程列表》](http://cmlakhan.github.io/courses/videos.html)\n\n介绍:(系统/算法/机器学习/深度学习/图模型/优化/...)在线视频课程列表.\n\n* [《Introduction to Topic Modeling in Python》](http://chdoig.github.io/pytexas2015-topic-modeling/)\n\n介绍:(PyTexas 2015)Python主题建模.\n\n* [《Large Scale Distributed Deep Learning on Hadoop Clusters》](http://yahoohadoop.tumblr.com/post/129872361846/large-scale-distributed-deep-learning-on-hadoop/)\n\n介绍:Hadoop集群上的大规模分布式机器学习.\n\n* [《Top Deep Learning Employers Based On LinkedIn Data》](http://www.vordot.com/deep-learning-employers-w-12020/)\n\n介绍:基于LinkedIn数据得出的深度学习热门\"东家\"排行.\n\n* [《Neural Net in C++ Tutorial》](https://vimeo.com/19569529)\n\n介绍:(c++)神经网络手把手实现教程.\n\n* [《Large-scale CelebFaces Attributes (CelebA) Dataset》](http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html)\n\n介绍:香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集： Large-scale CelebFaces Attributes (CelebA) Dataset 10K 名人，202K 脸部图像，每个图像40余标注属性.\n\n* [《Unsupervised Feature Learning in Computer Vision》](https://www.cs.nyu.edu/web/Research/Theses/goroshin_ross.pdf)\n\n介绍:面向机器视觉的无监督特征学习,[Ross Goroshin's webpage](https://cs.nyu.edu/~goroshin/).\n\n* [《Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks》](http://arxiv.org/pdf/1506.03099v3.pdf)\n\n介绍:谷歌研究院Samy Bengio等人最近写的RNN的Scheduled Sampling训练方法论文.\n\n* [《Essential Machine Learning Algorithms in a nutshell》](https://manish.wordpress.com/2015/10/02/essential-machine-learning-algorithms-in-a-nutshell/)\n\n介绍:机器学习基本算法简要入门.\n\n* [《A Huge List of Machine Learning And Statistics Repositories》](http://blog.josephmisiti.com/a-huge-list-of-machine-learning-repositories/)\n\n介绍:Github机器学习/数学/统计/可视化/深度学习相关项目大列表.\n\n* [《Information Processing and Learning》](http://www.cs.cmu.edu/~aarti/Class/10704_Spring15/lecs.html)\n\n介绍:CMU的信息论课程.\n\n* [《Scheduled sampling for sequence prediction with recurrent neural networks》](http://arxiv.org/pdf/1506.03099v3.pdf)\n\n介绍:谷歌研究院[Samy Bengio](http://bengio.abracadoudou.com/)等人最近写的RNN的Scheduled Sampling训练方法论文.\n\n* [《基于Hadoop集群的大规模分布式深度学习》](http://www.csdn.net/article/2015-10-01/2825840)\n\n介绍:基于Hadoop集群的大规模分布式深度学习.\n\n* [《Learning both Weights and Connections for Efficient Neural Networks习》](http://arxiv.org/abs/1506.02626)\n\n介绍:来自斯坦福大学及NVIDIA的工作，很实在很实用。采用裁剪网络连接及重训练方法，可大幅度减少CNN模型参数。针对AlexNet、VGG等模型及ImageNet数据，不损失识别精度情况下，模型参数可大幅度减少9-13倍.\n\n* [《Apache Singa --A General Distributed Deep Learning Platform》](http://www.comp.nus.edu.sg/~dbsystem/singa/)\n\n介绍:无需做深度学习就能用的分布式深度学习软件,[github](https://github.com/apache/incubator-singa).\n\n* [《24 Ultimate Data Scientists To Follow in the World Today》](http://www.analyticsvidhya.com/blog/2015/09/ultimate-data-scientists-world-today/)\n\n介绍:当今世界最NB的25位大数据科学家,通过他们的名字然后放在google中搜索肯定能找到很多很棒的资源[译文](http://blog.csdn.net/heyongluoyao8/article/details/48598169).\n\n* [《Deep Learning for NLP - Lecture October 2015》](https://github.com/nreimers/deeplearning4nlp-tutorial/tree/master/2015-10_Lecture/)\n\n介绍:Nils Reimers面向NLP的深度学习(Theano/Lasagne)系列教程.\n\n* [《Connection between probability theory and real analysis》](https://ccle.ucla.edu/mod/page/view.php?id=834267)\n\n介绍:主讲人是[陶哲轩](https://ccle.ucla.edu/mod/page/view.php?id=834267),资料[Probability: Theory and Examples](http://www.math.duke.edu/~rtd/PTE/PTE4_1.pdf),[笔记](https://terrytao.wordpress.com/category/275a-probability-theory/).\n\n* [《Data Science Learning Resources》](http://www.districtdatalabs.com/#!resources/c21hq)\n\n介绍:数据科学(学习)资源列表.\n\n* [《8 Tactics to Combat Imbalanced Classes in Your Machine Learning Dataset》](http://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/)\n\n介绍:应对非均衡数据集分类问题的八大策略.\n\n* [《Top 20 Data Science MOOCs》](https://datarithms.wordpress.com/2015/08/16/top-20-data-science-moocs/)\n\n介绍:重点推荐的20个数据科学相关课程.\n\n* [《Recurrent Neural Networks》](https://shapeofdata.wordpress.com/2015/10/20/recurrent-neural-networks/)\n\n介绍:递归神经网络.\n\n* [《Histograms of Oriented Gradients》](http://www.cs.duke.edu/courses/fall15/compsci527/notes/hog.pdf)\n\n介绍:(HOG)学习笔记.\n\n* [《Computational modelling courses》](http://aidanhorner.blogspot.co.uk/2015/10/computational-modelling-courses.html)\n\n介绍:计算建模/计算神经学课程汇总.\n\n* [《How We Use Deep Learning to Classify Business Photos at Yelp》](http://engineeringblog.yelp.com/2015/10/how-we-use-deep-learning-to-classify-business-photos-at-yelp.html)\n\n介绍:(Yelp)基于深度学习的商业图片分类.\n\n* [《Neural Networks and Deep Learning》](http://neuralnetworksanddeeplearning.com/)\n\n介绍:免费在线书《Neural Networks and Deep Learning》神经网络与深度学习。目前提供了前四章的草稿，[第一章](http://mp.weixin.qq.com/s?__biz=MzIxMjAzNDY5Mg==&mid=400067748&idx=1&sn=9c88eadfba5462281cd496e85ba3329c)通过手写数字识别的例子介绍NN，第二章讲反向传播算法，第三章讲反向传播算法的优化，第四章讲NN为什么能拟合任意函数。大量python代码例子和交互动画，生动有趣.[中文版](https://tigerneil.gitbooks.io/neural-networks-and-deep-learning-zh/content/)\n\n* [《Books to Read if You Might Be Interested in Data Science》](http://www.datasciguide.com/books-to-read-if-you-might-be-interested-in-data-science/)\n\n介绍:数据科学大咖荐书(入门).\n\n* [《Deep Learning for NLP resources》](https://github.com/andrewt3000/DL4NLP)\n\n介绍:NLP 深度学习资源列表.\n\n* [《GitXiv》](http://gitxiv.com/)\n\n介绍:很多arXiv上面知名论文可以在这个网站找到github的项目链接.\n\n* [《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》](http://arxiv.org/pdf/1510.07945v1.pdf)\n\n介绍:深度学习在视觉跟踪的探索.\n\n* [《Beginners Guide: Apache Spark Machine Learning Scenario With A Large Input Dataset》](http://fullstackml.com/2015/10/29/beginners-guide-apache-spark-machine-learning-scenario-with-a-large-input-dataset/)\n\n介绍:Spark机器学习入门实例——大数据集(30+g)二分类.\n\n* [《Semantic Scholar》](https://www.semanticscholar.org/)\n\n介绍:保罗艾伦人工智能实验室表示，Google Scholar是十年前的产物，他们现在想要做进一步的提高。于是推出了全新的，专门针对科学家设计的学术搜索引擎Semantic Scholar.\n\n* [《Semi-Supervised Learning》](http://www.acad.bg/ebook/ml/MITPress-%20SemiSupervised%20Learning.pdf)\n\n介绍:半监督学习,Chapelle.篇篇都是经典,作者包括Vapnik,Bengio,Lafferty,Jordan.此外推荐[Xiaojin (Jerry) Zhu](http://pages.cs.wisc.edu/~jerryzhu/)编写的[Introduction to Semi-Supervised Learning](http://www.morganclaypool.com/doi/abs/10.2200/S00196ED1V01Y200906AIM006).\n\n介绍:Spark机器学习入门实例——大数据集(30+g)二分类.\n\n* [《Free Resources for Beginners on Deep Learning and Neural Network》](http://www.analyticsvidhya.com/blog/2015/11/free-resources-beginners-deep-learning-neural-network/)\n\n介绍:为入门者准备的深度学习与神经网络免费资源.\n\n* [《TensorFlow is an Open Source Software Library for Machine Intelligence》](http://tensorflow.org/)\n\n介绍:Google 开源最新机器学习系统 TensorFlow,此外提供TensorFlow白皮书[white paper of tensorflow 2015](http://pan.baidu.com/s/1jGyFPki).[hacker news](https://news.ycombinator.com/item?id=10532957),[Google大牛解读TensorFlow](https://www.youtube.com/watch?v=90-S1M7Ny_o&t=21m2s)\n\n* [《Veles:Distributed machine learning platform》](https://github.com/samsung/veles)\n\n介绍:三星开源的快速深度学习应用程序开发分布式平台.\n\n* [《DMTK:Microsoft Distributed Machine Learning Tookit 》](https://github.com/Microsoft/DMTK)\n\n介绍:分布式机器学习工具包.\n\n* [《Semantics Approach to Big Data and Event Processing》](http://wiki.knoesis.org/index.php/BigDataTutorial)\n\n介绍:语义大数据——大数据/事件处理的语义方法.\n\n* [《LSTM(Long Short Term Memory)和RNN(Recurrent)学习教程》](http://www.zhihu.com/question/29411132)\n\n介绍:LSTM(Long Short Term Memory)和RNN(Recurrent)学习教程.\n\n* [《Marvin：A minimalist GPU-only N-dimensional ConvNet framework》](http://marvin.is/)\n\n介绍:Princeton Vision Group的深度学习库开源.\n\n* [《Ufora is a compiled, automatically parallel subset of python for data science and numerical computing》](http://ufora.github.io/ufora/)\n\n介绍:基于AWS的自动分布式科学计算库Ufora,[Why I Open Sourced Five Years of Work](https://medium.com/art-marketing/why-i-open-sourced-five-years-of-work-c5b5e0e38a6d).\n\n* [《Deep Learning and Deep Data Science - PyCon SE 2015》](https://www.youtube.com/watch?v=wBKfGaakFp8&hd=1)\n\n介绍:(PyCon SE 2015)深度学习与深度数据科学.\n\n* [《Zhi-Hua Zhou Papers》](https://scholar.google.com/citations?user=rSVIHasAAAAJ&hl=zh-CN&oi=ao)\n\n介绍:推荐南京大学机器学习与数据挖掘研究所所长——周志华教授的Google学术主页.\n\n* [《Advanced Linear Models for Data Science》](https://leanpub.com/lm)\n\n介绍:免费书:面向数据科学的高级线性模型.\n\n* [《Net2Net: Accelerating Learning via Knowledge Transfer》](http://arxiv.org/abs/1511.05641)\n\n介绍:基于知识迁移的神经网络高效训练Net2Net.\n\n* [《徐亦达机器学习课程 Variational Inference》](https://www.youtube.com/playlist?list=PLFze15KrfxbF0n1zTNoFIaDpxnSyfgNgc)\n\n介绍:徐亦达机器学习课程 Variational Inference.\n\n* [《Learning the Architecture of Deep Neural Networks》](http://arxiv.org/abs/1511.05497v1)\n\n介绍:深度神经网络结构学习.\n\n* [《Multimodal Deep Learning》](http://ai.stanford.edu/~ang/papers/icml11-MultimodalDeepLearning.pdf)\n\n介绍:来自斯坦福大学的Multimodal Deep Learning papers.\n\n* [《深度学习简析,TensorFlow,Torch,Theano,Mxnet》](http://chiffon.gitcafe.io/2015/11/16/long.html)\n\n介绍:深度学习简析,TensorFlow,Torch,Theano,[Mxnet](https://github.com/dmlc/mxnet).\n\n* [《\"Notes Essays —CS183C: Technology-enabled Blitzscaling — Stanford University》](https://medium.com/notes-essays-cs183c-technology-enabled-blitzscalin/latest)\n\n介绍:这个专栏是一个stanford学生做的CS183c课程的一个note，该课程是由Reid Hoffman等互联网boss级人物开设的，每节课请一位巨头公司的相关负责人来做访谈，讲述该公司是怎么scale的。最新两期分别请到了雅虎的梅姐和airbnb创始人Brian Chesky。.\n\n* [《Natural Language Understanding with Distributed Representation》](https://github.com/nyu-dl/NLP_DL_Lecture_Note)\n\n介绍:基于分布式表示的自然语言理解(100+页),[论文](http://arxiv.org/abs/1511.07916).\n\n* [《Recommender Systems Handbook》](http://link.springer.com/book/10.1007/978-1-4899-7637-6)\n\n介绍:推荐系统手册.\n\n* [《Understanding LSTM Networks》](http://colah.github.io/posts/2015-08-Understanding-LSTMs/index.html)\n\n介绍:理解LSTM网络[翻译](http://www.csdn.net/article/2015-11-25/2826323).\n\n* [《Machine Learning at Quora》](https://www.linkedin.com/pulse/machine-learning-quora-xavier-amatriain)\n\n介绍:机器学习在quora中的应用.\n\n* [《On Learning to Think: Algorithmic Information Theory for Novel Combinations of Reinforcement Learning Controllers and Recurrent Neural World Models》](http://arxiv.org/abs/1511.09249)\n\n介绍:思维学习——RL+RNN算法信息论.\n\n* [《The 5 Ways Data Scientists Keep Learning After College》](https://blog.rjmetrics.com/2015/12/01/the-5-ways-data-scientists-keep-learning-after-college/)\n\n介绍:数据科学家毕业后继续学习的5种方式.\n\n* [《Deep Learning in Neural Networks: An Overview》](http://arxiv.org/abs/1404.7828)\n\n介绍:深度学习在神经网络的应用.\n\n* [《Contextual Learning》](http://arxiv.org/abs/1511.06429)\n\n介绍:上下文学习,[代码](https://gitlab.tubit.tu-berlin.de/rbo-lab/concarne).\n\n* [《Machine Learning For Complete Beginners》](http://pythonforengineers.com/machine-learning-for-complete-beginners/)\n\n介绍:机器学习零基础入门,[代码](https://github.com/shantnu/Titanic-Machine-Learning).\n\n* [《2015年中国计算机学会（CCF）优秀博士学位论文》](http://www.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2897719129810)\n\n介绍:2015年度CCF优秀博士学位论文奖论文列表.\n\n* [《Learning to Hash Paper, Code and Dataset》](http://cs.nju.edu.cn/lwj/L2H.html)\n\n介绍:Learning to Hash Paper, Code and Dataset.\n\n* [《Neural networks with Theano and Lasagne》](https://www.youtube.com/watch?v=dtGhSE1PFh0)\n\n介绍:(PyData2015)基于Theano/Lasagne的CNN/RNN教程,[github](https://github.com/ebenolson/pydata2015).\n\n* [《神经网络与深度学习讲义》](http://vdisk.weibo.com/s/ayG13we2ltDAT)\n\n介绍:复旦大学[邱锡鹏](http://weibo.com/xpqiu)老师编写的神经网络与深度学习讲义,[ppt](http://vdisk.weibo.com/s/ayG13we2lDzcV).\n\n* [《Microsoft Open Sources Distributed Machine Learning Toolkit》](http://www.dmtk.io/index.html)\n\n介绍:微软亚洲研究院开源分布式机器学习工具包.\n\n* [《语音识别的技术原理是什么？》](https://www.zhihu.com/question/20398418)\n\n介绍:语音识别的技术原理浅析\n\n* [《Michael I. Jordan》](http://www.cs.berkeley.edu/~jordan/)\n\n介绍:迈克尔·I.乔丹的主页.根据主页可以找到很多资源。迈克尔·I.乔丹是知名的计算机科学和统计学学者，主要研究机器学习和人工智能。他的重要贡献包括指出了机器学习与统计学之间的联系，并推动机器学习界广泛认识到贝叶斯网络的重要性。\n\n* [《Geoff Hinton》](http://www.cs.toronto.edu/~hinton/)\n\n介绍:杰弗里·埃弗里斯特·辛顿 FRS是一位英国出生的计算机学家和心理学家，以其在神经网络方面的贡献闻名。辛顿是反向传播算法和对比散度算法的发明人之一，也是深度学习的积极推动者.通过他的主页可以发掘到很多Paper以及优秀学生的paper,此外推荐他的学生[Yann Lecun](http://yann.lecun.com/)主页\n\n* [《Yoshua Bengio》](http://www.iro.umontreal.ca/~bengioy/yoshua_en/index.html)\n\n介绍:Yoshua Bengio是机器学习方向的牛人,如果你不知道可以阅读[对话机器学习大神Yoshua Bengio（上）](http://www.infoq.com/cn/articles/ask-yoshua-bengio),[对话机器学习大神Yoshua Bengio（下）](http://www.infoq.com/cn/articles/ask-yoshua-bengio-2)\n\n* [《Large Scale Deep Learning within google》](http://static.googleusercontent.com/media/research.google.com/en/us/people/jeff/CIKM-keynote-Nov2014.pdf)\n\n介绍:google大规模深度学习应用演进\n\n* [《Deep Learning: An MIT Press Book in Preparation》](http://goodfeli.github.io/dlbook/)\n\n介绍:MIT出版的深度学习电子书,公开电子书\n\n* [《A Mathematical Theory of Deep Convolutional Neural Networks for Feature Extraction》](http://arxiv.org/abs/1512.06293)\n\n介绍:深度卷积神经网络(CNN)提取特征的数学理论\n\n* [《Microsoft Research Asia：Kaiming He》](http://research.microsoft.com/en-us/um/people/kahe/)\n\n介绍:推荐微软亚洲研究院何恺明主页\n\n* [《Speech and Language Processing (3rd ed. draft)》](http://web.stanford.edu/~jurafsky/slp3/)\n\n介绍:《语音与语言处理》第三版(草稿)\n\n* [《LSA 311: Computational Lexical Semantics - Summer 2015》](http://web.stanford.edu/~jurafsky/li15/)\n\n介绍:Stanford新课\"计算词汇语义学\"\n\n* [《上海交大张志华老师的统计机器学习与机器学习导论视频》](http://ocw.sjtu.edu.cn/G2S/OCW/cn/CourseDetails.htm?Id=397)\n\n介绍:上海交大张志华老师的统计机器学习与机器学习导论视频[链接:](http://pan.baidu.com/s/1mgPi7jU )密码: r9ak .[概率基础](http://ocw.sjtu.edu.cn/G2S/OCW/cn/CourseDetails.htm?Id=398)\n\n* [《Computational Linguistics and Deep Learning》](http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00239)\n\n介绍:computational linguistics and deep learning[视频](http://techtalks.tv/talks/computational-linguistics-and-deep-learning/61759/),推荐[Deep Learning: An Introduction from the NLP Perspective](https://speakerdeck.com/baojie/deep-learning-an-introduction-from-the-nlp-perspective-by-kevin-duh)\n\n* [《Black Hat USA 2015 - Deep Learning On Disassembly》](https://www.youtube.com/watch?v=zfVfpMcUkq8)\n\n介绍:(BlackHat2015)深度学习应用之流量鉴别(协议鉴别/异常检测),[slide])(https://www.blackhat.com/docs/us-15/materials/us-15-Wang-The-Applications-Of-Deep-Learning-On-Traffic-Identification.pdf),[material](https://www.blackhat.com/docs/us-15/materials/us-15-Wang-The-Applications-Of-Deep-Learning-On-Traffic-Identification-wp.pdf)\n\n* [《LibRec：A Java Library for Recommender Systems》](http://www.librec.net/)\n\n介绍:一个推荐系统的Java库\n\n* [《Multi-centrality Graph Spectral Decompositions and their Application to Cyber Intrusion Detection》](http://arxiv.org/abs/1512.07372)\n\n介绍:多中心图的谱分解及其在网络入侵检测中的应用(MC-GPCA&MC-GDL)\n\n* [《Computational Statistics in Python》](http://people.duke.edu/~ccc14/sta-663/)\n\n介绍:用Python学计算统计学\n\n* [《New open-source Machine Learning Framework written in Java》](http://blog.datumbox.com/new-open-source-machine-learning-framework-written-in-java/)\n\n介绍:datumbox-framework——Java的开源机器学习框架，该框架重点是提供大量的机器学习算法和统计检验，并能够处理中小规模的数据集\n\n* [《Awesome Recurrent Neural Networks》](http://jiwonkim.org/awesome-rnn/)\n\n介绍:递归神经网络awesome系列,涵盖了书籍,项目,paper等\n\n* [《Pedro Domingos》](http://homes.cs.washington.edu/~pedrod/)\n\n介绍:Pedro Domingos是华盛顿大学的教授,主要研究方向是机器学习与数据挖掘.在2015年的ACM webinar会议,曾发表了关于[盘点机器学习领域的五大流派](http://www.almosthuman.cn/2015/11/28/t8ysa/)主题演讲.他的个人主页拥有很多相关研究的paper以及他的教授课程.\n\n* [《Video resources for machine learning》](http://dustintran.com/blog/video-resources-for-machine-learning/)\n\n介绍:机器学习视频集锦\n\n* [《Deep Machine Learning libraries and frameworks》](https://medium.com/@abduljaleel/deep-machine-learning-libraries-and-frameworks-5fdf2bb6bfbe#.lwn2iyjsn)\n\n介绍:深度机器学习库与框架\n\n* [《大数据/数据挖掘/推荐系统/机器学习相关资源》](https://github.com/Flowerowl/Big-Data-Resources)\n\n介绍:这篇文章内的推荐系统资源很丰富,作者很有心,摘录了《推荐系统实战》内引用的论文.\n\n* [《Bayesian Methods in Astronomy: Hands-on Statistics》](http://nbviewer.ipython.org/github/jakevdp/AAS227Workshop/blob/master/Index.ipynb)\n\n介绍:(天文学)贝叶斯方法/MCMC教程——统计实战\n\n* [《Statistical Learning with Sparsity: The Lasso and Generalizations》](http://web.stanford.edu/~hastie/StatLearnSparsity/index.html)\n\n介绍:免费书:统计稀疏学习,作者[Trevor Hastie](http://web.stanford.edu/~hastie/)与[Rob Tibshirani](http://statweb.stanford.edu/~tibs/)都是斯坦福大学的教授,Trevor Hastie更是在统计学学习上建树很多\n\n* [《The Evolution of Distributed Programming in R》](http://www.mango-solutions.com/wp/2016/01/the-evolution-of-distributed-programming-in-r/)\n\n介绍:R分布式计算的进化,此外推荐[(R)气候变化可视化](https://aschinchon.wordpress.com/2016/01/07/climatic-change-at-a-glance/),[(R)马尔可夫链入门](http://blog.revolutionanalytics.com/2016/01/getting-started-with-markov-chains.html)\n\n* [《neon workshop at Startup.ML: Sentiment Analysis and Deep Reinforcement Learning》](http://www.nervanasys.com/neon-workshop-at-startup-ml-sentiment-analysis-and-deep-reinforcement-learning/)\n\n介绍:Nervana Systems在[Startup.ML](http://startup.ml/)的主题研讨会——情感分析与深度强化学习\n\n* [《Understanding Convolution in Deep Learning》](http://timdettmers.com/2015/03/26/convolution-deep-learning/)\n\n介绍:深度学习卷积概念详解.\n\n* [《Python libraries for building recommender systems》](http://faroba.com/2015/12/03/a-python-libraries-for-building-recommender-systems/)\n\n介绍:Python推荐系统开发库汇总.\n\n* [《Neural networks class - Université de Sherbrooke》](http://info.usherbrooke.ca/hlarochelle/neural_networks/content.html)\n\n介绍:超棒的神经网络课程，深入浅出介绍深度学习，由Hugo Larochelle（Yoshua Bengio的博士生，Geoffrey Hinton之前的博士后）主讲，强烈推荐.\n\n* [《CS231n: Convolutional Neural Networks for Visual Recognition》](http://vision.stanford.edu/teaching/cs231n/index.html)\n\n介绍:斯坦福新课程,面向视觉识别的卷积神经网络(Fei-Fei Li & Andrej Karpathy),[slides+video](http://vision.stanford.edu/teaching/cs231n/syllabus.html),[homework](http://cs231n.github.io/).\n\n* [《NIPS 2015 Deep Learning Symposium Part I》](http://yanran.li/peppypapers/2015/12/11/nips-2015-deep-learning-symposium-part-i.html)\n\n介绍:NIPS 2015会议总结第一部分,[第二部分](http://yanran.li/peppypapers/2016/01/09/nips-2015-deep-learning-symposium-part-ii.html).\n\n* [《python机器学习入门资料梳理》](http://michaelxiang.me/2015/12/16/python-machine-learning-list/)\n\n介绍:python机器学习入门资料梳理.\n\n* [《Reading Text in the Wild with Convolutional Neural Networks》](http://www.robots.ox.ac.uk/~vgg/publications/2016/Jaderberg16/)\n\n介绍:牛津大学著名视觉几何组VGG在IJCV16年首卷首期: Reading Text in the Wild with Convolutional Neural Networks,Jaderberg。这篇期刊文章融合了之前两篇会议(ECCV14,NIPS14ws)，定位和识别图片中的文本(叫text spotting)。 端到端系统: 检测Region + 识别CNN。论文、数据和代码.\n\n* [《Yet Another Computer Vision Index To Datasets (YACVID)》](http://riemenschneider.hayko.at/vision/dataset/)\n\n介绍:计算机视觉的一个较大的数据集索引, 包含387个标签，共收录了314个数据集合，点击标签云就可以找到自己需要的库了.\n\n* [《Why SLAM Matters, The Future of Real-Time SLAM, and Deep Learning vs SLAM》](http://www.computervisionblog.com/2016/01/why-slam-matters-future-of-real-time.html)\n\n介绍:Tombone 对 ICCV SLAM workshop 的总结： the future of SLAM, SLAM vs deep learning  重点介绍了 monoSLAM 和 LSD-SLAM，而且讨论了 feature-based 和 feature-free method 的长短。在全民deep learning做visual perception的时候，再来读读CV中的 geometry.\n\n* [《Python based Deep Learning Framework by Nervana™》](https://github.com/NervanaSystems/neon)\n\n介绍:Nervana Systems的开源深度学习框架neon发布.\n\n* [《mageNet and MS COCO Visual Recognition Challenges video and slider》](http://image-net.org/challenges/ilsvrc+mscoco2015)\n\n介绍:ICCV 2015的ImageNet比赛以及MS COCO竞赛联合研讨会的幻灯片和视频.\n\n* [《An Introduction to Machine Learning with Python》](http://blog.districtdatalabs.com/an-introduction-to-machine-learning-with-python)\n\n介绍:Python机器学习入门.\n\n* [《Neural Enquirer: Learning to Query Tables with Natural Language》](http://arxiv.org/abs/1512.00965)\n\n介绍:Neural Enquirer 第二版.\n\n* [《Deep Learning - Taking machine learning to the next level》](https://www.udacity.com/course/deep-learning--ud730)\n\n介绍:[Google]基于TensorFlow的深度学习/机器学习课程.\n\n* [《100 “must read” R-bloggers’ posts for 2015》](http://www.r-bloggers.com/100-must-read-r-bloggers-posts-for-2015/)\n\n介绍:R-bloggers网站2015\"必读\"的100篇文章,R语言学习的福音.\n\n* [《Machine Learning: a Probabilistic Perspective》](http://www.cs.ubc.ca/~murphyk/MLbook/index.html)\n\n介绍:推荐书籍:<机器学习：概率视角>,样章[Undirected graphical models Markov random fields](http://www.cs.ubc.ca/~murphyk/MLbook/pml-print3-ch19.pdf).\n\n* [《Deep learning Book》](http://www.deeplearningbook.org/)\n\n介绍:这是一本在线的深度学习书籍,合著者有Ian Goodfellow, Yoshua Bengio 和 Aaron Courville.如果你是一位新入门的学员可以先看这本书籍[Yoshua Bengio: How can one get started with machine learning?](https://www.quora.com/How-can-one-get-started-with-machine-learning-1).[中文译本](https://github.com/exacity/deeplearningbook-chinese).[一份简短的深度学习笔记](https://github.com/jianzhu/dl-notes)\n\n* [《UFLDL Recommended Readings》](http://ufldl.stanford.edu/wiki/index.php/UFLDL_Recommended_Readings)\n\n介绍:UFLDL推荐的深度学习阅读列表.\n\n* [《CSE 705: Deep Learning (Spring 2015)》](http://www.cse.buffalo.edu/~hungngo/classes/2015/705/)\n\n介绍:纽约州立大学布法罗分校2015年春季机器学习课程主页.\n\n* [《Theano is a Deep learning Python library 》](https://github.com/Theano/Theano)\n\n介绍: Theano是主流的深度学习Python库之一，亦支持GPU,入门比较难.推荐[Theano tutorial](https://github.com/marekrei/theano-tutorial),[Document](http://deeplearning.net/software/theano/tutorial/)\n\n* [《Statistical Language Models Based On Neural Networks》](http://www.fit.vutbr.cz/~imikolov/rnnlm/thesis.pdf)\n\n介绍:博士论文:神经网络统计语言模型.\n\n* [《文本数据的机器学习自动分类方法(上)》](http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data)\n\n介绍:[文本数据的机器学习自动分类方法(下)](http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data-part2).\n\n* [《Pixel Recurrent Neural Networks》](http://arxiv.org/abs/1601.06759)\n\n介绍:用RNN预测像素，可以把被遮挡的图片补充完整.\n\n* [《Computational Network Toolkit (CNTK)》](https://github.com/Microsoft/CNTK)\n\n介绍:微软研究院把其深度学习工具包CNTK,想进一步了解和学习CNTK的同学可以看前几天公布的《CNTK白皮书》[An Introduction to Computational Networks and the Computational Network Toolkit](http://research.microsoft.com/pubs/226641/CNTKBook-20160121.pdf).\n\n* [《Kalman and Bayesian Filters in Python》](https://github.com/rlabbe/Kalman-and-Bayesian-Filters-in-Python)\n\n介绍: 卡尔曼滤波器教材，用尽量少的数学和推导，传授直觉和经验，全部Python示例，内容覆盖卡尔曼滤波器、扩展卡尔曼滤波，无迹卡尔曼滤波等，包括练习和参考答案\n\n* [《Statistical inference for data science》](https://leanpub.com/LittleInferenceBook)\n\n介绍:在线免费书:面向数据科学的统计推断，R示例代码，很不错[GitHub](https://github.com/bcaffo/LittleInferenceBook).\n\n* [《Learning Deep Architectures for AI》](http://www.iro.umontreal.ca/~bengioy/papers/ftml_book.pdf)\n\n介绍:这本书是由Yoshua Bengio撰写的教程,其内容包含了学习人工智能所使用的深度学习架构的学习资源,书中的项目`已停止更新`[DeepLearnToolbox](https://github.com/rasmusbergpalm/DeepLearnToolbox).\n\n* [《Machine Learning Tutorials》](https://github.com/ujjwalkarn/Machine-Learning-Tutorials)\n\n介绍:这是一份机器学习和深度学习教程，文章和资源的清单。这张清单根据各个主题进行撰写，包括了许多与深度学习有关的类别、计算机视觉、加强学习以及各种架构.\n\n* [《Data science ipython notebooks》](https://github.com/donnemartin/data-science-ipython-notebooks)\n\n介绍:这是由Donne Martin策划收集的IPython笔记本。话题涵盖大数据、Hadoop、scikit-learn和科学Python堆栈以及很多其他方面的内容。至于深度学习，像是TensorFlow、Theano和Caffe之类的框架也均被涵盖其中，当然还有相关的特定构架和概念等.\n\n* [《Open Source Deep Learning Server》](http://www.deepdetect.com/)\n\n介绍:开源的深度学习服务,DeepDetect是C++实现的基于外部机器学习/深度学习库（目前是Caffe）的API。给出了图片训练（ILSVRC）和文本训练（基于字的情感分析，NIPS15）的样例，以及根据图片标签索引到ElasticSearch中[github](https://github.com/beniz/deepdetect).\n\n* [《Data Mining, Analytics, Big Data, and Data Science》](http://www.kdnuggets.com/)\n\n介绍:这是国外的一个科技频道,涵盖了数据挖掘,分析以及数据科学类的文章.偶尔还有机器学习精选.\n\n* [《Data Mining And Statistics: What's The Connection?》](http://docs.salford-systems.com/dm-stat.pdf)\n\n介绍:经典论文:数据挖掘与统计学.\n\n* [《(NIPS’2015 Tutorial)Yoshua Bengio深度学习》](https://drive.google.com/file/d/0BxKBnD5y2M8NVnBpbWVwYUpQTjg/view)\n\n介绍:NIPS’2015 Tutorial by Yoshua Bengio.\n\n* [《(NENO:Python based Deep Learning Framework》](https://github.com/NervanaSystems/neon)\n\n介绍:Nervana Systems的开源深度学习框架neon发布.\n\n* [《(Matt Might:Reading for graduate students》](http://matt.might.net/articles/books-papers-materials-for-graduate-students/)\n\n介绍:犹他州大学Matt Might教授推荐的研究生阅读清单.\n\n* [《Awesome Public Datasets》](https://github.com/caesar0301/awesome-public-datasets)\n\n介绍:开放数据集.\n\n* [《Introduction to Probability - The Science of Uncertainty》](https://www.edx.org/course/introduction-probability-science-mitx-6-041x-1)\n\n介绍:(edX)不确定性的科学——概率论导论(MITx).\n\n* [《R software and tools for everyday use》](http://xrds.acm.org/blog/2016/02/r-software-and-tools-for-everyday-use/)\n\n介绍:R语言开发常用软件/工具推荐.\n\n* [《Implementing Dynamic memory networks》](http://yerevann.github.io//2016/02/05/implementing-dynamic-memory-networks/)\n\n介绍:动态记忆网络实现.\n\n* [《Deeplearning4j 中文主页》](http://deeplearning4j.org/zh-index.html/)\n\n介绍:英文[主页](http://deeplearning4j.org)\n\n* [《Big Data Analysis Learning Resources: 50 Courses, Blogs, Tutorials, And More For Mastering Big Data Analytics》](http://www.ngdata.com/big-data-analysis-resources/)\n\n介绍:50个大数据分析最佳学习资源(课程、博客、教程等)\n\n* [《A Full Hardware Guide to Deep Learning》](http://timdettmers.com/2015/03/09/deep-learning-hardware-guide/)\n\n介绍:深度学习的全面硬件指南，从GPU到RAM、CPU、SSD、PCIe,[译文](http://www.almosthuman.cn/2016/02/04/bqrzz/)\n\n* [《Deep Residual Networks》](https://github.com/KaimingHe/deep-residual-networks)\n\n介绍:kaiming开源作品\n\n* [《The Definitive Guide to Natural Language Processing》](https://blog.monkeylearn.com/the-definitive-guide-to-natural-language-processing/)\n\n介绍:自然语言处理(NLP)权威指南\n\n* [《Evaluating language identification performance》](https://blog.twitter.com/2015/evaluating-language-identification-performance)\n\n介绍:如何在社会媒体上做语言检测？没有数据怎么办？推特官方公布了一个十分难得的数据集：12万标注过的Tweets，有70种语言\n\n* [《ICLR 2016 Accepted Papers》](http://www.iclr.cc/doku.php?id=iclr2016:main&#accepted_papers_conference_track)\n\n介绍:深度学习和机器学习重要会议ICLR 2016录取文章\n\n* [《Machine Learning: An In-Depth, Non-Technical Guide - Part 1》](http://www.innoarchitech.com/machine-learning-an-in-depth-non-technical-guide/)\n\n介绍:机器学习——深度非技术指南\n\n* [《Data Storytelling 101: Helpful Tools for Gathering Ideas, Designing Content & More》](http://blog.hubspot.com/marketing/toolbox-for-data-storytelling)\n\n介绍:数据叙事入门指南——创意生成/数据采集/内容设计相关资源推荐\n\n* [《WikiTableQuestions: a Complex Real-World Question Understanding Dataset》](http://nlp.stanford.edu/blog/wikitablequestions-a-complex-real-world-question-understanding-dataset/)\n\n介绍:WikiTableQuestions——复杂真实问答数据集\n\n* [《Big Data: 35 Brilliant And Free Data Sources For 2016》](http://www.forbes.com/sites/bernardmarr/2016/02/12/big-data-35-brilliant-and-free-data-sources-for-2016/#64ede4f16796)\n\n介绍:(2016版)35个超棒的免费大数据源\n\n* [《SPARKNET: training deep networks in spark》](http://arxiv.org/pdf/1511.06051v3.pdf)\n\n介绍:Ion Stoica和 Michael I. Jordan两位大家首次联手发文，CAFFE和SPARK完美结合，分布式深度学习混搭模式！[github](https://github.com/amplab/SparkNet)\n\n* [《DeepLearning.University – An Annotated Deep Learning Bibliography | Memkite》](http://memkite.com/deep-learning-bibliography/)\n\n介绍:深度学习(分类)文献集\n\n* [《Learning Deep Learning》](http://rt.dgyblog.com/ref/ref-learning-deep-learning.html)\n\n介绍:深度学习阅读列表\n\n* [《Awesome42 The easiest way to find R packages》](http://awesome42.com/)\n\n介绍:探索R包的好网站Awesome 42\n\n* [《MLbase:Distributed Machine Learning Made Easy》](http://mlbase.org/)\n\n介绍:MLbase是[Prof. Dr. Tim Kraska](http://cs.brown.edu/~kraskat/)的一个研究项目，MLbase是一个分布式机器学习管理系统\n\n* [《Deep Learning At Scale and At Ease》](http://www.comp.nus.edu.sg/~ooibc/singa-tomm.pdf)\n\n介绍:分布式深度学习平台[SINGA](http://singa.incubator.apache.org/index.html)介绍\n\n* [《Learn All About Apache Spark (100x Faster than Hadoop MapReduce)》](http://datasciencereport.com/2016/02/19/apache-spark/)\n\n介绍:Spark视频集锦\n\n* [《R For Deep Learning (I): Build Fully Connected Neural Network From Scratch》](http://www.parallelr.com/r-deep-neural-network-from-scratch/)\n\n介绍:R语言深度学习第一节:从零开始\n\n* [《A Visual Introduction to Machine Learning》](http://www.r2d3.us/visual-intro-to-machine-learning-part-1/)\n\n介绍:图解机器学习\n\n* [《Citation Network Dataset》](http://aminer.org/citation)\n\n介绍:AMiner论文引用数据集(v7:2,244,021 papers and 4,354,534 citation relationships)\n\n* [《Best Free Machine Learning Ebooks》](https://www.reddit.com/r/MachineLearning/comments/47ast8/best_free_machine_learning_ebooks/)\n\n介绍:10本最佳机器学习免费书\n\n* [《International Conference on Computer Vision (ICCV) 2015, Santiago》](http://videolectures.net/iccv2015_santiago/)\n\n介绍:ICCV15视频集\n\n* [《CaffeOnSpark Open Sourced for Distributed Deep Learning on Big Data Clusters》](https://github.com/yahoo/CaffeOnSpark)\n\n介绍::(Yahoo)基于Hadoop/Spark的分布式Caffe实现CaffeOnSpark\n\n* [《A Short Introduction to Learning to Rank》](http://research.microsoft.com/en-us/people/hangli/l2r.pdf)\n\n介绍:Learning to Rank简介\n\n* [《Global Deep learning researcher》](https://aminer.org/search/t=b&q=Deep%20Learning)\n\n介绍:全球深度学习专家列表,涵盖研究者主页\n\n* [《Top Spark Ecosystem Projects》](http://www.kdnuggets.com/2016/03/top-spark-ecosystem-projects.html)\n\n介绍:[Spark生态顶级项目汇总](http://www.infoq.com/cn/news/2016/03/spark-eco-project)\n\n* [《Proceedings of the 21st International Conference on Intelligent User Interfaces》](http://dl.acm.org/citation.cfm?id=2856767&preflayout=flat)\n\n介绍:[ACM IUI'16](http://iui.acm.org/2016/)论文集[Conference Navigator - Proceedings](http://halley.exp.sis.pitt.edu/cn3/proceedingswithauthors.php?conferenceID=139)\n\n* [《Machine Learning: An In-Depth, Non-Technical Guide - Part 1》](http://www.innoarchitech.com/machine-learning-an-in-depth-non-technical-guide/)\n\n介绍:深入机器学习,[2](http://www.innoarchitech.com/machine-learning-an-in-depth-non-technical-guide-part-2/),[3](http://www.innoarchitech.com/machine-learning-an-in-depth-non-technical-guide-part-3/),[4](http://www.innoarchitech.com/machine-learning-an-in-depth-non-technical-guide-part-4/)\n\n* [《Oxford Deep Learning》](http://www.computervisiontalks.com/tag/deep-learning-course/)\n\n介绍:[Nando de Freitas](https://www.cs.ox.ac.uk/people/nando.defreitas/)在 Oxford 开设的深度学习课程,[课程youtube地址](https://www.youtube.com/playlist?list=PLE6Wd9FR--EfW8dtjAuPoTuPcqmOV53Fu),Google DeepMind的研究科学家,此外[首页:computervisiontalks](http://www.computervisiontalks.com/)的内容也很丰富,如果你是做机器视觉方面的研究,推荐也看看其他内容.肯定收获也不小.还有,这位[youtube主页](https://www.youtube.com/channel/UC0z_jCi0XWqI8awUuQRFnyw)顶过的视频也很有份量\n\n* [《Neural Networks for Machine Learning》](https://www.coursera.org/course/neuralnets)\n\n介绍:Geoffrey Hinton在Coursera开设的MOOC\n\n* [《Deep Learning News》](http://news.startup.ml/)\n\n介绍:深度学习领域的Hacker news.紧跟深度学习的新闻、研究进展和相关的创业项目。从事机器学习,深度学习领域的朋友建议每天看一看\n\n* [《Maxout Networks》](http://jmlr.org/proceedings/papers/v28/goodfellow13.pdf)\n\n介绍:Maxout网络剖析\n\n* [《Advances in Neural Information Processing Systems》](http://papers.nips.cc/)\n\n介绍:NIPS领域的会议paper集锦\n\n* [《Machine learning applications in genetics and genomics》](http://www.nature.com/nrg/journal/v16/n6/abs/nrg3920.html)\n\n介绍:机器学习在生物工程领域的应用,如果你从事生物工程领域,可以先阅读一篇文章[详细介绍](https://www.zhihu.com/question/41428117/answer/91045285)\n\n* [《Deep Learning in Bioinformatics》](http://arxiv.org/abs/1603.06430)\n\n介绍:深度学习在生物信息学领域的应用\n\n* [《A Few Useful Things to Know about Machine Learning》](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf)\n\n介绍:一些关于机器学习需要知道知识,对于刚刚入门机器学习的同学应该读一读\n\n* [《Cambridge Machine Learning Group》](http://mlg.eng.cam.ac.uk/)\n\n介绍:剑桥大学机器学习用户组主页,网罗了剑桥大学一些机器学习领域专家与新闻\n\n* [《Randy Olson's data analysis and machine learning projects》](https://github.com/rhiever/Data-Analysis-and-Machine-Learning-Projects)\n\n介绍:[Randy Olson's](http://www.randalolson.com/blog/)的一些数据分析与机器学习项目库,是学习实践的好材料\n\n* [《GoLearn:Golang machine learning library》](https://github.com/sjwhitworth/golearn)\n\n介绍:Golang机器学习库,简单,易扩展\n\n* [《Swift Ai》](https://github.com/collinhundley/Swift-AI)\n\n介绍:用Swift开发苹果应用的倒是很多，而用来做机器学习的就比较少了.Swift Ai在这方面做了很多聚集.可以看看\n\n* [《Please explain Support Vector Machines (SVM) like I am a 5 year old》](https://www.reddit.com/r/MachineLearning/comments/15zrpp/please_explain_support_vector_machines_svm_like_i/)\n\n介绍:如何向一位5岁的小朋友解释支持向量机(SVM)\n\n* [《reddit Machine learning》](https://www.reddit.com/r/MachineLearning/)\n\n介绍: reddit的机器学习栏目\n\n* [《ComputerVision resource》](http://blog.csdn.net/carson2005/article/details/6601109)\n\n介绍: 计算机视觉领域的一些牛人博客，超有实力的研究机构等的网站链接.做计算机视觉方向的朋友建议多关注里面的资源\n\n* [《Multimedia Laboratory Homepage》](http://mmlab.ie.cuhk.edu.hk/index.html)\n\n介绍:香港中文大学深度学习研究主页,此外研究小组对[2013年deep learning 的最新进展和相关论文](http://mmlab.ie.cuhk.edu.hk/project_deep_learning.html)做了整理,其中useful links的内容很受益\n\n* [《Search Engines that Learn from Their Users》](http://www.anneschuth.nl/wp-content/uploads/thesis_anne-schuth_search-engines-that-learn-from-their-users.pdf)\n\n介绍: 这是一篇关于搜索引擎的博士论文,对现在普遍使用的搜索引擎google，bing等做了分析.对于做搜索类产品的很有技术参考价值\n\n* [《Deep Learning Books》](http://machinelearningmastery.com/deep-learning-books/)\n\n介绍: 深度学习书籍推荐(毕竟这类书比较少).\n\n* [《Towards Bayesian Deep Learning: A Survey》](http://arxiv.org/abs/1604.01662)\n\n介绍: 贝叶斯定理在深度学习方面的研究论文.\n\n* [《Revisiting Distributed Synchronous SGD》](http://arxiv.org/abs/1604.00981)\n\n介绍: 来自谷歌大脑的重温分布式梯度下降.同时推荐[大规模分布式深度网络](http://wxwidget.github.io/blog/2014/08/17/large-scale-deep-network/)\n\n* [《Research Issues in Social Computing》](http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.102.6931&rep=rep1&type=pdf)\n\n介绍: 社交计算研究相关问题综述.\n\n* [《What are some important areas of research in social computing right now?》](https://www.quora.com/What-are-some-important-areas-of-research-in-social-computing-right-now)\n\n介绍: 社交计算应用领域概览,里面有些经典论文推荐\n\n* [《Collaborative Filtering Recommender Systems》](http://files.grouplens.org/papers/FnT%20CF%20Recsys%20Survey.pdf)\n\n介绍: 协同过滤在推荐系统应用.\n\n* [《Content-Boosted Collaborative Filtering for Improved Recommendations》](http://www.cs.utexas.edu/~ml/papers/cbcf-aaai-02.pdf)\n\n介绍: 协同过滤在内容推荐的研究.\n\n* [《Unifying User-based and Item-based Collaborative Filtering Approaches by Similarity Fusion》](http://siplab.tudelft.nl/sites/default/files/sigir06_similarityfusion.pdf)\n\n介绍: 协同过滤经典论文.\n\n* [《Item-based Collaborative Filtering Recommendation Algorithms》](http://glaros.dtc.umn.edu/gkhome/fetch/papers/www10_sarwar.pdf)\n\n介绍: 协同过滤算法.\n\n* [《Amazon.com Recommendations Item-to-Item Collaborative Filtering》](http://www.cin.ufpe.br/~idal/rs/Amazon-Recommendations.pdf)\n\n介绍: 亚马逊对于协同过滤算法应用.\n\n* [《Collaborative Filtering for Implicit Feedback Datasets》](http://yifanhu.net/PUB/cf.pdf)\n\n介绍: 协同过滤的隐式反馈数据集处理.\n\n* [《Tutorials, papers and code for computer graphics, fractals and demoscene》](http://www.iquilezles.org/www/index.htm)\n\n介绍: 计算机图形，几何等论文，教程，代码.做计算机图形的推荐收藏.\n\n* [《ELEN 6886 Sparse Representation and High-Dimensional Geometry》](http://www.columbia.edu/~jw2966/6886_Fa2015.html)\n\n介绍: 推荐哥伦比亚大学课程，稀疏表示和高维几何.12年由Elsevier、13年至今由PAMI(仍由Elsevier赞助)设立的青年研究者奖(Young Researcher Award)授予完成博士学位后七年内取得杰出贡献的；由CV社区提名，在CVPR会议上宣布。2015年得主是哥大助理教授John Wright，09年[《健壮人脸识别的稀疏表示法》](http://www.columbia.edu/~jw2966/papers/WYGSM09-PAMI.pdf)引用已超5K.\n\n* [《Software engineer how to learning Machine learning》](https://www.quora.com/What-would-be-your-advice-to-a-software-engineer-who-wants-to-learn-machine-learning-3/answer/Alex-Smola-1)\n\n介绍: CMU机器学习系著名教授Alex Smola在Quora对于《程序员如何学习Machine Learning》的建议：Alex推荐了不少关于线性代数、优化、系统、和统计领域的经典教材和资料.\n\n* [《Book review: Fundamentals of Deep Learning》](http://www.opengardensblog.futuretext.com/archives/2015/08/book-review-fundamentals-of-deep-learning-designing-next-generation-artificial-intelligence-algorithms-by-nikhil-buduma.html)\n\n介绍: 书籍推荐,深度学习基础.[源码](https://github.com/darksigma/Fundamentals-of-Deep-Learning-Book)\n\n* [《Learning from Big Code》](http://learnbigcode.github.io/)\n\n介绍: 软件工程领域现在也对机器学习和自然语言处理很感兴趣，有人推出了“大代码”的概念，分享了不少代码集合，并且觉得ML可以用在预测代码Bug，预测软件行为，自动写新代码等任务上。大代码数据集下载\n\n* [《Object Detection》](http://handong1587.github.io/deep_learning/2015/10/09/object-detection.html)\n\n介绍: 深度学习进行目标识别的资源列表：包括RNN、MultiBox、SPP-Net、DeepID-Net、Fast R-CNN、DeepBox、MR-CNN、Faster R-CNN、YOLO、DenseBox、SSD、Inside-Outside Net、G-CNN\n\n* [《Deep Learning: Course by Yann LeCun at Collège de France 2016(Slides in English)》](https://www.facebook.com/yann.lecun/posts/10153505343037143)\n\n介绍: Yann LeCun 2016深度学习课程的幻灯片（Deep Learning  Course by Yann LeCun at Collège de France 2016）[百度云](http://pan.baidu.com/s/1jIIrljg )密码: cwsm [原地址](https://drive.google.com/folderview?id=0BxKBnD5y2M8NclFWSXNxa0JlZTg&usp=sharing)\n\n\n* [《Stanford HCI Group》](http://hci.stanford.edu/)\n\n介绍: 斯坦福人机交互组五篇CHI16文章。1.众包激励机制的行为经济学研究：批量结算比单任务的完成率高。2.在众包专家和新手间建立联系：微实习。3.词嵌入结合众包验证的词汇主题分类（如猫、狗属于宠物）。4.词嵌入结合目标识别的活动预测。5.鼓励出错以加快众包速度。\n\n* [《Learn Data Science》](https://github.com/nborwankar/LearnDataScience)\n\n介绍: 自学数据科学\n\n* [《CS224D Lecture 7 - Introduction to TensorFlow》](https://www.youtube.com/watch?v=L8Y2_Cq2X5s)\n\n介绍: 本课是[CS224D](http://cs224d.stanford.edu/)一节介绍TensorFlow课程，[ppt](http://cs224d.stanford.edu/lectures/CS224d-Lecture7.pdf),[DeepDreaming with TensorFlow](http://nbviewer.jupyter.org/github/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/deepdream/deepdream.ipynb)\n\n* [《Leaf - Machine Learning for Hackers》](http://autumnai.com/leaf/book/leaf.html)\n\n介绍: Leaf是一款机器学习的开源框架，专为黑客打造，而非为科学家而作。它用Rust开发，传统的机器学习，现今的深度学习通吃。[Leaf](https://github.com/autumnai/leaf)\n\n* [《MXnet:Flexible and Efficient library for deep learning》](http://on-demand.gputechconf.com/gtc/2016/video/S6853.html)\n\n介绍: [GTC 2016](http://on-demand-gtc.gputechconf.com/gtcnew/on-demand-gtc.php)视频，MXnet的手把手深度学习tutorial,相关参考资料[MXNet Tutorial for NVidia GTC 2016.](https://github.com/dmlc/mxnet-gtc-tutorial)\n\n* [《OpenAI Gym: Toolkit for developing, comparing reinforcement learning algorithms》](https://gym.openai.com/)\n\n介绍: OpenAI Gym：开发、比较强化学习算法工具箱\n\n* [《conference-iclr-2016 Papers and Code》](https://tensortalk.com/?cat=conference-iclr-2016)\n\n介绍: 机器学习会议ICLR 2016 论文的代码集合\n\n* [《probabilistic graphical models principles and techniques》](https://github.com/JimmyLin192/GraphicalModel/blob/master/Probabilistic%20Graphical%20Models%20Principles%20and%20Techniques.pdf)\n\n介绍: 此书是斯坦福大学概率图模型大牛Daphne Koller所写，主要涉及的是贝叶斯网络和马尔科夫逻辑网络的learning和inference问题，同时又对PGM有深刻的理论解释，是学习概率图模型必看的书籍。难度中上，适合有一些ML基础的研究生.[备份地址](https://vk.com/doc168073_304660839?hash=39a33dd8aa6b141d8a&dl=b6674\n\n* [《BigDL: Distributed Deep learning on Apache Spark》](https://github.com/intel-analytics/BigDL)\n\n介绍: Spark分布式深度学习库BigDL\n\n* [《Machine Learning and Cyber Security Resources》](http://www.kdnuggets.com/2017/01/machine-learning-cyber-security.html)\n\n介绍: 这是一份关于机器学习和数据挖掘在网络安全方面应用的资源帖，包含了一些重要的站点，论文，书籍,斯坦福课程以及一些有用的教程.\n\n* [《6.S094: Deep Learning for Self-Driving Cars》](http://selfdrivingcars.mit.edu/)\n\n介绍: 麻省理工学院（MIT）开设课程.S094：自主驾驶汽车的深度学习\n\n* [《ICML 2016 Conference and Workshops Video》](http://techtalks.tv/icml/2016/)\n\n介绍: ICML 2016视频集锦\n\n* [《机器学习Machine-Learning》](https://github.com/JustFollowUs/Machine-Learning)\n\n介绍: 机器学习推荐学习路线及参考资料\n\n* [《TensorFlow and deep learning, without a PhD》](https://codelabs.developers.google.com/codelabs/cloud-tensorflow-mnist)\n\n介绍:新手入门，通过TensorFlow入门深度学习\n\n* [《How To Get Into Natural Language Processing》](https://blog.ycombinator.com/how-to-get-into-natural-language-processing/)\n\n介绍: 自然语言处理(NLP)入门指南\n\n* [《Deep learning and the Schrödinger equation》](https://arxiv.org/abs/1702.01361)\n\n介绍:通过神经网络跳过数值方法求解薛定谔方程。\n\n* [《Recent Advances in Distributed Machine Learning》](http://www.dmtk.io/slides/distributedML-aaai2017.pdf)\n\n介绍:微软亚洲研究院的刘铁岩等人近日在AAAI 2017上做的有关优化以及大规模机器学习的Tutorial。很值得一看。里面对传统的优化算法，特别是一些理论特性以及分布式算法的相应理论特性都有一个比较详尽的总结。非常适合想快速了解这些领域的学者和工程师。另外，这个Tutorial还介绍了DMTK的一些情况，作为一个分布式计算平台的优缺点，还顺带比较了Spark和TensorFlow等流行框架。\n\n* [《Deep Learning Implementations and Frameworks (DLIF)》](https://sites.google.com/site/dliftutorial/)\n\n介绍:AAAI 2017的Tutorial，专门讲述了深度学习框架的设计思想和实现，比较若干种流行框架（Caffe、MXNet、TensorFlow、Chainer等）的性能和异同。 \n\n* [《Open Sourcing TensorFlowOnSpark: Distributed Deep Learning on Big-Data Clusters》](https://github.com/yahoo/TensorFlowOnSpark)\n\n介绍:雅虎开源基于spark与TensorFlow的分布式数据深度学习框架,博文[介绍](https://yahooeng.tumblr.com/post/157196488076/open-sourcing-tensorflowonspark-distributed-deep)\n\n* [《Deconstruction with Discrete Embeddings》](http://r2rt.com/deconstruction-with-discrete-embeddings.html)\n\n介绍:用离散嵌入解构模糊数据\n\n* [《Reliable Machine Learning in the Wild - NIPS 2016 Workshop》](https://sites.google.com/site/wildml2016nips/schedule)\n\n介绍:视频发布：自然场景可靠机器学习(NIPS 2016 Workshop)\n\n* [《A large-scale dataset of manually annotated audio events》](https://research.google.com/audioset/)\n\n介绍:Google发布大规模音频数据集\n\n* [《5 algorithms to train a neural network》](https://www.neuraldesigner.com/blog/5_algorithms_to_train_a_neural_network)\n\n介绍:训练神经网络的5种算法\n\n* [《Course notes for CS224N Winter17》](https://github.com/stanfordnlp/cs224n-winter17-notes)\n\n介绍:笔记：斯坦福CS224n深度学习NLP课程(2017),课程地址[http://web.stanford.edu/class/cs224n/](http://web.stanford.edu/class/cs224n/).这个里面的[设计报告堪比国内博士论文](http://web.stanford.edu/class/cs224n/reports.html)\n\n* [《Persontyle Workshop for Applied Deep Learning》](https://github.com/telecombcn-dl/2017-persontyle)\n\n介绍:伦敦深度学习研讨会资料\n\n* [《Understanding, generalisation, and transfer learning in deep neural networks》](https://blog.acolyer.org/2017/02/27/understanding-generalisation-and-transfer-learning-in-deep-neural-networks/)\n\n介绍:论文导读：深度神经网络理解、泛化与迁移学习,[acolyer blog](https://blog.acolyer.org/)上还有很多经典推荐可以阅读\n\n* [《An Introduction to MCMC for Machine Learning》](http://www.cs.princeton.edu/courses/archive/spr06/cos598C/papers/AndrieuFreitasDoucetJordan2003.pdf)\n\n介绍:面向机器学习的马尔科夫链蒙特卡洛(MCMC)\n\n* [《Awesome Deep learning papers and other resources》](https://github.com/endymecy/awesome-deeplearning-resources)\n\n介绍:深度学习论文与资源大列表(论文、预训练模型、课程、图书、软件、应用、相关列表等)\n\n* [《Datasets for Natural Language Processing》](https://github.com/karthikncode/nlp-datasets)\n\n介绍:自然语言处理NLP数据集列表\n\n* [《Machine Learning for Software Engineers》](https://github.com/ZuzooVn/machine-learning-for-software-engineers)\n\n介绍:软件工程师的机器学习\n\n* [《Quantitative Finance resources》](https://github.com/wilsonfreitas/awesome-quant)\n\n介绍:量化金融(Quants)资源列表\n\n* [《What Computers Still Can't Do.》](https://books.google.com.hk/books?id=7vS2y-mQmpAC)\n\n介绍:《计算机仍然不能做什么——人工理性批判》[MIT版导言](http://shc2000.sjtu.edu.cn/20120630/MIT.htm)\n\n* [《In-Datacenter Performance Analysis of a Tensor Processing Unit》](https://drive.google.com/file/d/0Bx4hafXDDq2EMzRNcy1vSUxtcEk/view)\n\n介绍:谷歌发论文详解TPU\n\n* [《Proceedings of the Eleventh International Conference on Web and Social Medias》](http://www.aaai.org/Library/ICWSM/icwsm17contents.php)\n\n介绍:2017年ICWSM会议论文合集，业内对它的评价是:\"算是最顶级也是最早的有关社会计算的会议\"。里面的论文大部分是研究社交网络的，例如twitter，emoji，游戏。对于社交媒体来说内容还是挺前沿的。如果你是做社会计算的还是可以看看。毕竟是行业内数一数二的会议。对了，只要是你知道名字的有名社交媒体都有投稿.[陌陌不算]\n\n* [《NTUEE ML 2017》](http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17.html)\n\n介绍:台大李宏毅中文机器学习课程(2017)\n\n* [《TensorFlow Dev Summit 2017》](https://www.youtube.com/playlist?list=PLwv-rHS37fS9sj62f4HAbqSrC1EiPsNZx)\n\n介绍:2017 TensorFlow 开发者峰会(中文字幕) \n\n* [《Convolutional Neural Networks for Visual Recognition (CS231n Spring 2017)》](https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv)\n\n介绍:斯坦福2017季CS231n深度视觉识别课程视频\n\n* [《Deep Learning for Music (DL4M)》](https://github.com/ybayle/awesome-deep-learning-music)\n\n介绍:音乐深度学习相关资料大列表(音乐生成/语音分离/说话人识别等)\n\n* [《Deep Learning for Music (DL4M)》](https://people.cs.umass.edu/~arvind/arvind_thesis.pdf)\n\n介绍:博士论文：深度神经网络知识表示与推理,附[视频](https://www.youtube.com/watch?v=lc68_d_DnYs)\n\n* [《Recent Deep Learning papers in NLU and RL》](https://github.com/madrugado/deep-learning-nlp-rl-papers)\n\n介绍:近期自然语言理解(NLU)/增强学习(RL)文献选集\n\n* [《Theories of Deep Learning (STATS 385)》](https://stats385.github.io/)\n\n介绍:2017年斯坦福课程：深度学习理论\n\n* [Unlabeled Samples Generated by GAN Improve the Person Re-identification Baseline in vitro](https://github.com/layumi/Person-reID_GAN)\n\n介绍: **ICCV2017 spotlight** 用GAN生成样本，加入监督学习(如ResNet) 提升小样本数据集效果。\n\n* [A Discriminatively Learned CNN Embedding for Person Re-identification ](https://github.com/layumi/2016_person_re-ID)\n\n介绍: **TOMM2017** 用 鉴别loss(Verification)+识别loss(Identification) 来提升深度学习框架（CaffeNet VGGNet ResNet）下 行人重识别检索效果   Caffe版本(https://github.com/D-X-Y/caffe-reid)\n\n* [Pedestrian Alignment Network for Large-scale Person Re-identification ](https://github.com/layumi/Pedestrian_Alignment)\n\n介绍： 行人对齐和行人重识别一起做。统一框架。\n\n* [《On the Information Bottleneck Theory of Deep Learning》](https://openreview.net/forum?id=ry_WPG-A-&noteId=ry_WPG-A-)\n\n介绍:论深度学习信息瓶颈理论\n\n* [《CMU CS 11-747, Fall 2017 Neural Networks for NLP》](http://phontron.com/class/nn4nlp2017/)\n\n介绍:CMU神经网络自然语言处理课程\n\n* [《Awesome Chainer》](https://github.com/chainer-community/awesome-chainer)\n\n介绍:Chainer是一个深度学习框架，提供了很多解决方案，例如动态计算图。它是基于Python编写的\n\n* [《StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation》](https://arxiv.org/abs/1711.09020)\n\n介绍:用StarGAN实现人脸部件、性别、年龄、表情等变化。实现[代码](https://github.com/yunjey/StarGAN). YouTube上面有简单的[视频](https://www.youtube.com/watch?v=EYjdLppmERE)介绍。@layumi\n\n* [《Feature Visualization》](https://distill.pub/2017/feature-visualization/)\n\n介绍:利用神经网络增加对图像理解，对特征进行可视化。同时推荐[《Visualizing and Understanding Convolutional Networks》](https://cs.nyu.edu/~fergus/papers/zeilerECCV2014.pdf)。本文是Matthew D.Zeiler 和Rob Fergus于（纽约大学）13年撰写的论文，主要通过Deconvnet（反卷积）来可视化卷积网络，来理解卷积网络，并调整卷积网络；本文通过Deconvnet技术，可视化Alex-net，并指出了Alex-net的一些不足，最后修改网络结构，使得分类结果提升。[中文摘要翻译](http://blog.csdn.net/whiteinblue/article/details/43312059) @layumi\n\n* [《Random Erasing Data Augmentation》](https://arxiv.org/abs/1708.04896)2\n\n介绍:本文提出了一种叫做“Random Erasing”的数据增强方法，通过给图像数据加入随机的噪声进行数据增强，防止过拟合，可以移植到其他的CV任务中。[代码实现](https://github.com/zhunzhong07/Random-Erasing) @layumi\n\n* [《SVDNet for Pedestrian Retrieval》](https://arxiv.org/abs/1703.05693)\n\n介绍: SVDNet在行人重识别的应用[翻译](https://zhuanlan.zhihu.com/p/29326061)。[代码](https://github.com/syfafterzy/SVDNet-for-Pedestrian-Retrieval) @layumi\n\n* [《NIPS 2017 Notes》](https://cs.brown.edu/~dabel/blog/posts/misc/nips_2017.pdf)\n\n介绍: 2017年神经信息处理系统大会笔记\n\n* [《Hung-yi Lee Home page》](http://speech.ee.ntu.edu.tw/~tlkagk/)\n\n介绍: 推荐台湾大学的李宏毅教授的主页，他的[机器学习课程](http://speech.ee.ntu.edu.tw/~tlkagk/courses.html)很适合初学者。不会枯燥无味\n\n* [《Kloud Strife DL papers of the year》](https://kloudstrifeblog.wordpress.com/2017/12/15/my-papers-of-the-year/)\n\n介绍: Kloud Strife总结了2017年阅读的论文，对抗网络学习、SGD（随机梯度下降）、模型设计与生成、强化学习\n\n* [《Oxford Deep NLP 2017 course》](https://github.com/oxford-cs-deepnlp-2017/lectures)\n\n介绍: 牛津大学2017年深度自然语言处理课程视频与slides\n\n* [《Speech and Language Processing, 3rd Edition》](https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf)\n\n介绍: 斯坦福大学免费电子书《语音和语言处理》第3版，自然语言处理概论，有关计算语言学和语音识别的知识。\n\n* [《A Brief Introduction to Machine Learning for Engineers》](https://arxiv.org/pdf/1709.02840.pdf)\n\n介绍: 由伦敦国王学院编写的<工程师机器学习简明教程>\n\n* [《An Introduction to Machine Learning with R》](https://lgatto.github.io/IntroMachineLearningWithR/index.html)\n\n介绍: 免费书：R语言机器学习导论\n\n* [《An Introduction to Deep Learning for Tabular Data》](http://www.fast.ai/2018/04/29/categorical-embeddings/)\n\n介绍: 表格数据深度学习入门\n\n* [《OpenAI Scholars 2018 Reinforcement Learning Syllabus》](https://hollygrimm.com/syllabus_rl)\n\n介绍: OpenAI Scholars 2018 强化训练大纲.\n\n* [《Deep reinforcement learning》](https://www.youtube.com/playlist?list=PLJV_el3uVTsODxQFgzMzPLa16h6B8kWM_)\n\n介绍: 李宏毅深度强化学习课程（国语）\n\n* [《Intro to Neural Networks and Machine Learning》](http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/)\n\n介绍: 多伦多大学课程：CSC 321 Winter 2018.神经网络与机器学习入门\n\n* [《UC Berkeley：Deep Reinforcement Learning》](http://rail.eecs.berkeley.edu/deeprlcourse/)\n\n介绍: UC Berkeley深度強化學習課程,[Youtube](https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37) 、[Bilibili](https://www.bilibili.com/video/av32730838/)\n\n* [《The Illustrated Transformer》](https://jalammar.github.io/illustrated-transformer/)\n\n介绍: 图解Transformer\n\n* [《EE363 - Linear Dynamical Systems》](http://stanford.edu/class/ee363/lectures.html)\n\n介绍: 斯坦福《线性动态系统》课程讲义\n\n* [《Google at EMNLP 2018》](https://ai.googleblog.com/2018/10/google-at-emnlp-2018.html)\n\n介绍: Google的EMNLP 2018成果汇总\n\n* [《COMPGI22 - Advanced Deep Learning and Reinforcement Learning》](https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs)\n\n介绍: 伦敦大学的深度学习与强化学习进阶课程。[slide](https://github.com/enggen/DeepMind-Advanced-Deep-Learning-and-Reinforcement-Learning)\n\n* [《Causal Inference(drafts)》](https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/)\n\n介绍: 书稿：因果推理概念与方法. [code](https://github.com/jrfiedler/causal_inference_python_code)\n\n* [《INF556 -- Topological Data Analysis (2018-19)》](http://www.enseignement.polytechnique.fr/informatique/INF556/index.html)\n\n介绍: 课程资料：拓扑数据分析。非官方[笔记](https://tlacombe.github.io/teaching/notesCoursINF556/)\n\n* [《paper with code》](https://paperswithcode.com)\n\n介绍: 有时会遇到找Paper的时候还需要找代码。时间一晃眼就过去了。现在有一个站点集合论文与代码一起。涵盖计算机视觉、自然语言、语音、医疗、生物等各个领域的机器学习论文\n\n* [《awesome network embedding》](https://github.com/chihming/awesome-network-embedding)\n\n介绍: 网络嵌入,也被称为图嵌入方法。推荐國立政治大學[陈启明](http://cherry.cs.nccu.edu.tw/~g10018/portfolio/)博士整理的推荐阅读列表。[图嵌入论文阅读列表](https://github.com/benedekrozemberczki/awesome-graph-classification)\n\n* [《Awesome Community Detection》](https://github.com/benedekrozemberczki/awesome-community-detection)\n\n介绍: 社区发现算法用来发现网络中的社区结构，也可以视为一种广义的聚类算法。做社交网络的朋友推荐阅读[社区发现（community detection）未来的路到底该何去何从？](https://www.zhihu.com/question/32127662) 以及基于NetworkX构建的项目[karateclub](https://github.com/benedekrozemberczki/karateclub)\n\n* [《SLAM Resources》](https://github.com/ckddls1321/SLAM_Resources)\n\n介绍: 即时定位与地图构建资源列表，主要是这个领域的论文、算法、数据集、相关开发工具\n\n* [《Fraud Detection Research Papers》](https://github.com/benedekrozemberczki/awesome-fraud-detection-papers)\n\n介绍: 反欺诈相关论文阅读列表，在金融领域反欺诈一直是一个非常重要的部分。贯穿整个金融系统。随着经济的发展，电商、保险等行业需要引入欺诈检测。论文列表中涉及的部分涵盖电商、交易、社交网络、银行多个行业的案例与实践。\n\n* [《Awesome model compression》](https://github.com/ChanChiChoi/awesome-model-compression)\n\n介绍: 深度神经网络的压缩方法相关论文阅读列表。卷积神经网络日益增长的深度和尺寸为深度学习在移动端的部署带来了巨大的挑战，CNN模型压缩与加速成为了学术界和工业界都重点关注的研究领域之一。\n\n* [《Best Resources for Imbalanced Classification》](https://machinelearningmastery.com/resources-for-imbalanced-classification/)\n\n介绍: 不平衡分类其主要关注于如何从类别分布不均衡的数据中学习数据的模式。本篇介绍了一些解决不平衡类分类问题的多种学习资源\n\n* [《Machine learning system design pattern》](https://github.com/mercari/ml-system-design-pattern)\n\n介绍: 机器学习系统设计模式，涵盖QA、训练、提供服务、devops运维等场景 \n\n* [《Advanced Machine learning》](https://www.aminer.cn/aml)\n\n介绍: 来自清华大学的机器学习课程，课程主要介绍机器学习的理论和相关算法；课程内容涵盖基础篇：经典机器学习方法的回顾、概率图生成模型（Generative learning）和概率图判别模型（Discriminative learning），进阶篇：介绍最近流行的深度学习、表示学习、增强学习、自动机器学习以及对抗学习，高级篇：介绍当前热点的预训练、自学习以及认知图谱等\n\n"
  },
  {
    "path": "ds.md",
    "content": "## 分布式系统(Distributed System)资料\n\n##### 希望转载的朋友，你可以不用联系我．但是**一定要保留原文链接**，因为这个项目还在继续也在不定期更新．希望看到文章的朋友能够学到更多．\n\n\n* [《Reconfigurable Distributed Storage for Dynamic Networks》](http://sydney.edu.au/engineering/it/~gramoli/doc/pubs/OPODIS05.pdf)\n\n介绍:这是一篇介绍在动态网络里面实现分布式系统重构的paper.论文的作者(导师)是MIT读博的时候是做分布式系统的研究的,现在在NUS带学生,不仅仅是[分布式系统](http://www.comp.nus.edu.sg/~gilbert/biblio-projects.html#rambo),还有无线网络.如果感兴趣可以去他的主页了解.\n\n* [《Distributed porgramming liboratory》](http://lpd.epfl.ch/site)\n\n介绍:分布式编程实验室,他们发表的很多的[paper](http://lpd.epfl.ch/site/Publications),其中不仅仅是学术研究,还有一些工业界应用的论文.\n\n* [《MIT Theory of Distributed Systems》](http://groups.csail.mit.edu/tds/)\n\n介绍:麻省理工的分布式系统理论主页,作者南希·林奇在2002年证明了[CAP理论](http://zh.wikipedia.org/wiki/CAP%E5%AE%9A%E7%90%86),并且著《分布式算法》一书.\n\n* [《Notes on Distributed Systems for Young Bloods》](http://www.somethingsimilar.com/2013/01/14/notes-on-distributed-systems-for-young-bloods/)\n\n介绍:分布式系统搭建初期的一些建议\n\n* [《Principles of Distributed Computing》](http://dcg.ethz.ch/lectures/podc_allstars/)\n\n介绍:分布式计算原理课程\n\n* [《Google's Globally-Distributed Database》](http://research.google.com/archive/spanner.html)\n\n介绍:Google全球分布式数据介绍,[中文版](http://dblab.xmu.edu.cn/wp-content/uploads/2012/09/20120925_094508_876.pdf)\n\n* [《The Architecture Of Algolia’s Distributed Search Network》](http://highscalability.com/blog/2015/3/9/the-architecture-of-algolias-distributed-search-network.html)\n\n介绍:Algolia的分布式搜索网络的体系架构介绍\n\n* [《Build up a High Availability Distributed Key-Value Store》](https://medium.com/@siddontang/build-up-a-high-availability-distributed-key-value-store-b4e02bc46e9e)\n\n介绍:构建高可用分布式Key-Value存储系统\n\n* [《Distributed Search Engine with Nanomsg and Bond》](https://daniel-j-h.github.io/post/distributed-search-nanomsg-bond/)\n\n介绍:Nanomsg和Bond的分布式搜索引擎\n\n* [《Distributed Processing With MongoDB And Mongothon》](http://tech.gc.com/distributed-processing-with-mongodb-and-mongothon/)\n\n介绍:使用MongoDB和Mongothon进行分布式处理\n\n* [《Salt: Combining ACID and BASE in a Distributed Database》](http://muratbuffalo.blogspot.jp/2015/02/salt-combining-acid-and-base-in.html)\n\n介绍:分布式数据库中把[ACID与BASE](http://www.sigma.me/2011/06/17/database-ACID-and-BASE.html)结合使用.\n\n* [《Makes it easy to understand Paxos for Distributed Systems》](http://paxos.systems/)\n\n介绍:理解的Paxos的分布式系统,[参考阅读:关于Paxos的历史](http://duanple.blog.163.com/blog/static/709717672012112203543166/)\n\n* [《There is No Now Problems with simultaneity in distributed systems》](http://queue.acm.org/detail.cfm?id=2745385)\n\n介绍:There is No Now Problems with simultaneity in distributed systems\n\n* [《Distributed Systems》](http://www0.cs.ucl.ac.uk/staff/ucacwxe/lectures/ds98-99/)\n\n介绍:伦敦大学学院分布式系统课程课件.\n\n* [《Distributed systems for fun and profit》](http://book.mixu.net/distsys/index.html)\n\n介绍:分布式系统电子书籍.涵盖内容：分布式系统介绍、全序和偏序、时钟、复制模型.适合分布式系统入门的同学。国内也有一些[笔记](https://blog.csdn.net/u012618715/article/details/76652831)\n\n* [《95-702 — Distributed Systems for Information Systems Management》](http://www.andrew.cmu.edu/course/95-702/)\n\n介绍:卡内基梅隆大学春季分布式课程主页\n\n* [《Distributed Systems: Concepts and Design (5th Edition)》](https://azmuri.files.wordpress.com/2013/09/george-coulouris-distributed-systems-concepts-and-design-5th-edition.pdf)\n\n介绍: 电子书,分布式系统概念与设计(第五版)\n\n* [《走向分布式》](http://ithelp.ithome.com.tw/profile/share?id=20060041)\n\n介绍:这是一位台湾网友 ccshih 的文字，短短的篇幅介绍了分布式系统的若干要点。[pdf](http://dcaoyuan.github.io/papers/pdfs/Scalability.pdf)\n\n* [《Introduction to Distributed Systems Spring 2013》](http://thu-cmu.cs.tsinghua.edu.cn/curriculum/dscourse/index.htm)\n\n介绍:清华大学分布式系统课程主页,里面的schedule栏目有很多宝贵的资源\n\n* [《Distributed systems》](http://book.mixu.net/distsys/index.html)\n\n介绍:免费的在线分布式系统书籍\n\n* [《Some good resources for learning about distributed computing》](http://www.quora.com/What-are-some-good-resources-for-learning-about-distributed-computing-Why)\n\n介绍:Quora上面的一篇关于学习分布式计算的资源.\n\n* [《Spanner: Google’s Globally-Distributed Database》](http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/es//archive/spanner-osdi2012.pdf)\n\n介绍:这个是第一个全球意义上的分布式数据库，也是Google的作品。其中介绍了很多一致性方面的设计考虑，为了简单的逻辑设计，还采用了原子钟，同样在分布式系统方面具有很强的借鉴意义.\n\n* [《The Chubby lock service for loosely-coupled distributed systems》](http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/zh-CN//archive/chubby-osdi06.pdf)\n\n介绍:Google的统面向松散耦合的分布式系统的锁服务,这篇论文详细介绍了Google的分布式锁实现机制Chubby。Chubby是一个基于文件实现的分布式锁，Google的Bigtable、Mapreduce和Spanner服务都是在这个基础上构建的，所以Chubby实际上是Google分布式事务的基础，具有非常高的参考价值。另外，著名的zookeeper就是基于Chubby的开源实现.推荐[The google stack](http://malteschwarzkopf.de/research/assets/google-stack.pdf),[Youtube:The Chubby lock service for loosely-coupled distributed systems](https://www.youtube.com/watch?v=PqItueBaiRg)\n\n* [《Sinfonia: a new paradigm for building scalable distributed systems》](http://www.sosp2007.org/papers/sosp064-aguilera.pdf)\n\n介绍:这篇论文是SOSP2007的Best Paper，阐述了一种构建分布式文件系统的范式方法，个人感觉非常有用。淘宝在构建TFS、OceanBase和Tair这些系统时都充分参考了这篇论文.\n\n* [《Data-Intensive Text Processing with MapReduce》](http://lintool.github.io/MapReduceAlgorithms/MapReduce-book-final.pdf)\n\n介绍:Ebook:Data-Intensive Text Processing with MapReduce.\n\n* [《Design and Implementation of a Query Processor for a Trusted Distributed Data Base Management System》](http://www.utdallas.edu/~bxt043000/Publications/Journal-Papers/DAS/J16_Design_and_Implementation_of_a_Distributed_Query_Processor.pdf)\n\n介绍:Design and Implementation of a Query Processor for a Trusted Distributed Data Base Management System.\n\n* [《Distributed Query Processing》](http://ogsa-dai.sourceforge.net/documentation/ogsadai4.0/ogsadai4.0-gt/DQPPart.html)\n\n介绍:分布式查询入门.\n\n* [《Distributed Systems and the End of the API》](http://writings.quilt.org/2014/05/12/distributed-systems-and-the-end-of-the-api/)\n\n介绍:分布式系统和api总结.\n\n* [《Distributed Query Reading》](http://www.andrew.cmu.edu/course/15-749/READINGS/required/)\n\n介绍:分布式系统阅读论文，此外还推荐github上面的一个论文列表[The Distributed Reader](http://reiddraper.github.io/distreader/)。\n\n* [《Replication, atomicity and order in distributed systems》](http://afeinberg.github.io/2011/06/17/replication-atomicity-and-order-in-distributed-systems.html)\n\n介绍:Replication, atomicity and order in distributed systems\n\n* [《MIT course:Distributed Systems》](http://nil.csail.mit.edu/6.824/2018/)\n\n介绍:2017年MIT分布式系统课程主页，用Golang作为授课语言。[6.824 Distributed Systems](https://pdos.csail.mit.edu/6.824/)课程主页.课程的课堂测试[Past Exams](https://pdos.csail.mit.edu/6.824/quizzes.html)可以很好的考察学习的结果。对于学习分布式系统比较推荐这个课程\n\n* [《Distributed systems for fun and profit》](http://book.mixu.net/distsys/)\n\n介绍:免费分布式系统电子书。\n\n* [《Ori：A Secure Distributed File System》](http://ori.scs.stanford.edu/)\n\n介绍:斯坦福开源的分布式文件系统。\n\n* [《Availability in Globally Distributed Storage Systems》](http://static.googleusercontent.com/media/research.google.com/en/us/pubs/archive/36737.pdf)\n\n介绍:Google论文：设计一个高可用的全球分布式存储系统。\n\n* [《Calvin: Fast Distributed Transactions For Partitioned Database Systems》](http://highscalability.com/blog/2013/5/23/paper-calvin-fast-distributed-transactions-for-partitioned-d.html)\n\n介绍:对于分区数据库的分布式事务处理。\n\n* [《Distributed Systems Building Block: Flake Ids》](http://yellerapp.com/posts/2015-02-09-flake-ids.html)\n\n介绍:Distributed Systems Building Block: Flake Ids.\n\n* [《Introduction to Distributed System Design》](http://www.hpcs.cs.tsukuba.ac.jp/~tatebe/lecture/h23/dsys/dsd-tutorial.html)\n\n介绍:Google Code University课程，如何设计一个分布式系统。\n\n* [《Sheepdog: Distributed Storage System for KVM》](http://sheepdog.github.io/sheepdog/)\n\n介绍:KVM的分布式存储系统.\n\n* [《Readings in Distributed Systems Systems》](http://henryr.github.io/distributed-systems-readings/)\n\n介绍:分布式系统课程列表,包括数据库、算法等.\n\n* [《Tera》](https://github.com/BaiduPS/tera)\n\n介绍:来自百度的分布式表格系统.\n\n* [《Distributed systems: for fun and profit》](https://github.com/mixu/distsysbook)\n\n介绍:分布式系统的在线电子书.\n\n* [《Distributed Systems Reading List》](https://github.com/notgary/distributed-systems-reading-list)\n\n介绍:分布式系统资料,此外还推荐[Various articles about distributed systems](https://github.com/hiremaga/readings).\n\n* [《Designs, Lessons and Advice from Building Large Distributed Systems》](http://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote-ladis2009.pdf)\n\n介绍:Designs, Lessons and Advice from Building Large Distributed Systems.\n\n* [《Testing a Distributed System》](http://queue.acm.org/detail.cfm?ref=rss&id=2800697)\n\n介绍:Testing a distributed system can be trying even under the best of circumstances.\n\n* [《The Google File System》](https://research.google.com/archive/gfs-sosp2003.pdf)\n\n介绍: 基于普通服务器构建超大规模文件系统的典型案例，主要面向大文件和批处理系统， 设计简单而实用。 GFS是google的重要基础设施， 大数据的基石， 也是Hadoop HDFS的参考对象。 主要技术特点包括： 假设硬件故障是常态（容错能力强）， 64MB大块， 单Master设计，Lease/链式复制， 支持追加写不支持随机写.\n\n* [《Bigtable: A Distributed Storage System for Structured Data》](https://research.google.com/archive/bigtable-osdi06.pdf)\n\n介绍:支持PB数据量级的多维非关系型大表， 在google内部应用广泛，大数据的奠基作品之一 ， Hbase就是参考BigTable设计。 Bigtable的主要技术特点包括： 基于GFS实现数据高可靠， 使用非原地更新技术（LSM树）实现数据修改， 通过range分区并实现自动伸缩等.[中文版](http://dblab.xmu.edu.cn/wp-content/uploads/2012/05/20120508_172346_207.pdf)\n\n* [《PacificA: Replication in Log-Based Distributed Storage Systems》](http://research.microsoft.com:8082/pubs/66814/tr-2008-25.pdf)\n\n介绍:面向log-based存储的强一致的主从复制协议， 具有较强实用性。 这篇文章系统地讲述了主从复制系统应该考虑的问题， 能加深对主从强一致复制的理解程度。 技术特点： 支持强一致主从复制协议， 允许多种存储实现， 分布式的故障检测/Lease/集群成员管理方法.\n\n* [《Object Storage on CRAQ, High-throughput chain replication for read-mostly workloads》](http://sns.cs.princeton.edu/docs/craq-usenix09.pdf)\n\n介绍:分布式存储论文:支持强一直的链式复制方法， 支持从多个副本读取数据,实现[code](https://github.com/jterrace/craq).\n\n* [《Finding a needle in Haystack: Facebook’s photo storage》](https://www.usenix.org/legacy/event/osdi10/tech/full_papers/Beaver.pdf)\n\n介绍:Facebook分布式Blob存储,主要用于存储图片. 主要技术特色:小文件合并成大文件,小文件元数据放在内存因此读写只需一次IO.\n\n\n* [《Windows Azure Storage: A Highly Available Cloud Storage Service with Strong Consistency》](http://www-bcf.usc.edu/~minlanyu/teach/csci599-fall12/papers/11-calder.pdf)\n\n介绍: 微软的分布式存储平台, 除了支持类S3对象存储，还支持表格、队列等数据模型. 主要技术特点：采用Stream/Partition两层设计（类似BigTable）;写错（写满）就封存Extent,使得副本字节一致, 简化了选主和恢复操作; 将S3对象存储、表格、队列、块设备等融入到统一的底层存储架构中.\n\n* [《Paxos Made Live – An Engineering Perspective》](http://www.eecs.harvard.edu/cs262/Readings/paxosmadelive.pdf)\n\n介绍:从工程实现角度说明了Paxo在chubby系统的应用， 是理解Paxo协议及其应用场景的必备论文。 主要技术特点： paxo协议， replicated log， multi-paxo.[参考阅读:关于Paxos的历史](http://duanple.blog.163.com/blog/static/709717672012112203543166/)\n\n* [《Dynamo: Amazon’s Highly Available Key-Value Store》](http://www.allthingsdistributed.com/files/amazon-dynamo-sosp2007.pdf)\n\n介绍:Amazon设计的高可用的kv系统,主要技术特点：综和运用一致性哈希,vector clock,最终一致性构建一个高可用的kv系统， 可应用于amazon购物车场景.新内容来自[分布式存储必读论文](http://50vip.com/423.html)\n\n* [《Efficient Replica Maintenance for Distributed Storage Systems》](http://oceanstore.cs.berkeley.edu/publications/papers/pdf/carbonite06.pdf)\n\n介绍:分布式存储系统中的副本存储问题.\n\n* [《PADS: A Policy Architecture for Distributed Storage Systems》](https://www.cs.nyu.edu/rgrimm/papers/nsdi09.pdf)\n\n介绍:分布式存储系统架构.\n\n* [《The Chirp Distributed Filesystem》](http://ccl.cse.nd.edu/software/chirp/)\n\n介绍:开源分布式文件系统Chirp,对于想深入研究的开发者可以阅读文章的相关Papers.\n\n* [《Time, Clocks, and the Ordering of Events in a Distributed System》](http://research.microsoft.com/en-us/um/people/lamport/pubs/time-clocks.pdf)\n\n介绍:经典论文分布式时钟顺序的实现原理.\n\n* [《Making reliable distributed systems in the presence of sodware errors》](http://www.erlang.org/download/armstrong_thesis_2003.pdf)\n\n介绍:面向软件错误构建可靠的分布式系统,[中文笔记](http://www.cnblogs.com/me-sa/archive/2012/05/20/2510564.html).\n\n* [《MapReduce: Simplified Data Processing on Large Clusters》](https://research.google.com/archive/mapreduce-osdi04.pdf)\n\n介绍:MapReduce:超大集群的简单数据处理.\n\n* [《Distributed Computer Systems Engineering》](http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/index.htm)\n\n介绍:麻省理工的分布式计算课程主页,里面的ppt和阅读列表很多干货.\n\n* [《The Styx Architecture for Distributed Systems》](http://www.vitanuova.com/inferno/papers/styx.html)\n\n介绍:分布式系统Styx的架构剖析.\n\n* [《What are some good resources for learning about distributed computing? Why?》](https://www.quora.com/What-are-some-good-resources-for-learning-about-distributed-computing-Why)\n\n介绍:Quora上面的一个问答:有哪些关于分布式计算学习的好资源.\n\n* [《RebornDB: The Next Generation Distributed Key-Value Store》](http://highscalability.com/blog/2015/7/8/reborndb-the-next-generation-distributed-key-value-store.html)\n\n介绍:下一代分布式k-v存储数据库.\n\n* [《Operating System Concepts Ninth Edition》](http://codex.cs.yale.edu/avi/os-book/OS9/)\n\n介绍:分布式系统归根结底还是需要操作系统的知识,这是耶鲁大学的操作系统概念书籍首页,里面有提供了第8版的在线电子版和最新的学习操作系统指南,学习分布式最好先学习操作系统.\n\n* [《The Log: What every software engineer should know about real-time data's unifying abstraction》](http://engineering.linkedin.com/distributed-systems/log-what-every-software-engineer-should-know-about-real-time-datas-unifying)\n\n介绍:分布式系统Log剖析,非常的详细与精彩. [中文翻译](https://github.com/oldratlee/translations/blob/master/log-what-every-software-engineer-should-know-about-real-time-datas-unifying/README.md) |  [中文版笔记](http://www.cnblogs.com/foreach-break/p/notes_about_distributed_system_and_The_log.html).\n\n* [《Operating Systems Study Guide》](http://faculty.salina.k-state.edu/tim/ossg/index.html)\n\n介绍:分布式系统基础之操作系统学习指南.\n\n* [《分布式系统领域经典论文翻译集》](http://duanple.com/?p=170)\n\n介绍:分布式系统领域经典论文翻译集.\n\n* [《Maintaining performance in distributed systems》](https://speakerdeck.com/elasticsearch/maintaining-performance-in-distributed-systems)\n\n介绍:分布式系统性能维护.\n\n* [《Computer Science from the Bottom Up》](http://www.bottomupcs.com/)\n\n介绍:计算机科学，自底向上,小到机器码,大到操作系统内部体系架构,学习操作系统的另一个在线好材料.\n\n* [《Operating Systems: Three Easy Pieces》](http://pages.cs.wisc.edu/~remzi/OSTEP/)\n\n介绍:<操作系统:三部曲>在线电子书,虚拟、并发、持续.\n\n* [《Database Systems: reading list》](http://www.cs286.net/home/reading-list)\n\n介绍:数据库系统经典论文阅读列,此外推送github上面的[db reading](https://github.com/rxin/db-readings).\n\n* [《Unix System Administration》](http://www.washington.edu/R870/)\n\n介绍:Unix System Administration ebook.\n\n* [《The Amoeba Distributed Operating System》](https://www.cs.vu.nl/~ast/publications/compcom-1991.pdf)\n\n介绍:分布式系统经典论文.\n\n* [《Principles of Computer Systems》](http://web.mit.edu/6.826/archive/S04/)\n\n介绍:计算机系统概念，以分布式为主.此外推荐[Introduction to Operating Systems](http://www2.cs.uregina.ca/~hamilton/courses/330/notes/index.html)笔记\n\n* [《Person page of EMİN GÜN SİRER》](http://www.cs.cornell.edu/People/egs/)\n\n介绍:推荐康奈尔大学的教授EMİN GÜN SİRER的主页,他的研究项目有分布式,数据存储。例如[HyperDex](http://hyperdex.org/papers/)数据库就是他的其中一个项目之一.\n\n* [《Scalable, Secure, and Highly Available Distributed File Access》](http://www.cs.cmu.edu/afs/cs/project/coda-www/ResearchWebPages/docdir/scalable90.pdf)\n\n介绍:来自卡内基梅隆如何构建可扩展的、安全、高可用性的分布式文件系统,[其他papers](http://www.cs.cmu.edu/afs/cs/project/coda-www/ResearchWebPages/docdir/).\n\n* [《Distributed (Deep) Machine Learning Common》](http://dmlc.github.io/)\n\n介绍:分布式机器学习常用库.\n\n* [《The Datacenter as a Computer》](http://www.cs.berkeley.edu/~rxin/db-papers/WarehouseScaleComputing.pdf)\n\n介绍:介绍了如何构建仓储式数据中心,尤其是对于现在的云计算,分布式学习来说很有帮助.本书是[Synthesis Lectures on Computer Architecture](http://www.morganclaypool.com/toc/cac/1/1)系列的书籍之一,这套丛书还有 《The Memory System》,《Automatic Parallelization》,《Computer Architecture Techniques for Power Efficiency》,《Performance Analysis and Tuning for General Purpose Graphics Processing Units》,《Introduction to Reconfigurable Supercomputing》,[Memory Systems Cache, DRAM, Disk](http://www.e-reading.club/bookreader.php/138837/Jacob,_Ng,_Wang_-_Memory_systems._Cache,_DRAM,_Disk.pdf) 等\n\n* [《helsinki:Distributed Systems Course slider》](http://www.cs.helsinki.fi/u/jakangas/Teaching/)\n\n介绍:来自芬兰赫尔辛基的分布式系统课程课件:什么是分布式,复制,一致性,容错,同步,通信.\n\n* [《TiDB is a distributed SQL database》](https://github.com/pingcap/tidb)\n\n介绍:分布式数据库TiDB,Golang开发.\n\n* [《S897: Large-Scale Systems》](http://people.csail.mit.edu/matei/courses/2015/6.S897/)\n\n介绍:课程资料:大规模系统.\n\n* [《Large-scale L-BFGS using MapReduce》](http://papers.nips.cc/paper/5333-consistency-of-weighted-majority-votes)\n\n介绍:使用MapReduce进行大规模分布式集群环境下并行L-BFGS.\n\n* [《Twitter是如何构建高性能分布式日志的》](http://www.infoq.com/cn/news/2015/09/BookKeeper-Twitter)\n\n介绍:Twitter是如何构建高性能分布式日志的.\n\n* [《Distributed Systems: When Limping Hardware Is Worse Than Dead Hardware》](http://danluu.com/limplock/)\n\n介绍:在分布式系统中某个组件彻底死了影响很小，但半死不活（网络/磁盘），对整个系统却是毁灭性的.\n\n* [《Tera - 高性能、可伸缩的结构化数据库》](https://github.com/baidu/tera)\n\n介绍:来自百度的分布式数据库.\n\n* [《SequoiaDB is a distributed document-oriented NoSQL Database》](https://github.com/SequoiaDB/SequoiaDB)\n\n介绍:SequoiaDB分布式文档数据库开源.\n\n* [《Readings in distributed systems》](http://henryr.github.io/distributed-systems-readings/)\n\n介绍:这个网址里收集了一堆各TOP大学分布式相关的课程.\n\n* [《Paxos vs Raft》](https://ramcloud.stanford.edu/~ongaro/userstudy/)\n\n介绍:这个网站是[Raft算法](https://raft.github.io/)的作者为教授Paxos和[Raft算法](https://raft.github.io/)做的，其中有两个视频链接，分别讲上述两个算法.[参考阅读:关于Paxos的历史](http://duanple.blog.163.com/blog/static/709717672012112203543166/)\n\n* [《A Scalable Content-Addressable Network》](http://www.eecs.harvard.edu/~mema/courses/cs264/papers/p13-ratnasamy.pdf)\n\n介绍:A Scalable Content-Addressable Network.\n\n* [《500 Lines or Less》](https://github.com/aosabook/500lines)\n\n介绍:这个项目其实是一本书（ [The Architecture of Open Source Applications](http://aosabook.org/en/index.html)）的源代码附录，是一堆大牛合写的.\n\n* [《MIT 6.824 Distributed System》](http://nil.csail.mit.edu/6.824/2015/schedule.html)\n\n介绍:这只是一个课程主页，没有上课的视频，但是并不影响你跟着它上课：每一周读两篇课程指定的论文，读完之后看lecture-notes里对该论文内容的讨论，回答里面的问题来加深理解，最后在课程lab里把所看的论文实现。当你把这门课的作业刷完后，你会发现自己实现了一个分布式数据库.\n\n* [《HDFS-alike in Go》](https://github.com/michaelmaltese/golang-distributed-filesystem)\n\n介绍:使用go开发的分布式文件系统.\n\n* [《What are some good resources for learning about distributed computing? Why?》](https://www.quora.com/What-are-some-good-resources-for-learning-about-distributed-computing-Why)\n\n介绍:Quora上关于学习分布式的资源问答.\n\n* [《SeaweedFS is a simple and highly scalable distributed file system》](https://github.com/chrislusf/seaweedfs)\n\n介绍:SeaweedFS是使用go开发的分布式文件系统项目,代码简单，逻辑清晰.\n\n* [《Codis - yet another fast distributed solution for Redis》](https://github.com/wandoulabs/codis)\n\n介绍:Codis 是一个分布式 Redis 解决方案, 对于上层的应用来说, 连接到 Codis Proxy 和连接原生的 Redis Server 没有明显的区别 \n\n* [《Paper: Coordination Avoidance In Distributed Databases By Peter Bailis》](http://www.bailis.org/papers/bailis-thesis.pdf)\n\n介绍:Coordination Avoidance In Distributed Databases.\n\n* [《从零开始写分布式数据库》](https://github.com/ngaut/builddatabase)\n\n介绍:本文以[TiDB](https://github.com/pingcap/tidb) 源码为例.\n\n* [《what we talk about when we talk about distributed systems》](http://videlalvaro.github.io/2015/12/learning-about-distributed-systems.html)\n\n介绍:分布式系统概念梳理,为分布式系统涉及的主要概念进行了梳理.\n\n* [《Distributed locks with Redis》](http://redis.io/topics/distlock)\n\n介绍:使用Redis实现分布式锁.\n\n* [《CS244b: Distributed Systems》](http://www.scs.stanford.edu/14au-cs244b/)\n\n介绍: 斯坦福2014年秋季分布式课程.\n\n* [《RAMP Made Easy》](http://rustyrazorblade.com/2015/11/ramp-made-easy/)\n\n介绍: 分布式的“读原子性”.\n\n* [《Strategies and Principles of Distributed Machine Learning on Big Data》](http://arxiv.org/abs/1512.09295)\n\n介绍: 大数据分布式机器学习的策略与原理.\n\n* [《Distributed Systems: What is the CAP theorem?》](https://www.quora.com/Distributed-Systems/What-is-the-CAP-theorem)\n\n介绍: 分布式CAP法则.\n\n* [《How should I start to learn distributed storage system as a beginner?》](https://www.quora.com/How-should-I-start-to-learn-distributed-storage-system-as-a-beginner)\n\n介绍: 新手如何步入分布式存储系统.\n\n* [《Cassandra - A Decentralized Structured Storage System》](https://www.cs.cornell.edu/projects/ladis2009/papers/lakshman-ladis2009.pdf)\n\n介绍: 分布式存储系统Cassandra剖析,主要讲述系统设计、客户端API、以及facebook的应用。推荐白皮书[Introduction to Apache Cassandra](http://www.datastax.com/wp-content/uploads/2012/08/WP-IntrotoCassandra.pdf).\n\n* [《What is the best resource to learn about distributed systems?》](https://www.quora.com/What-is-the-best-resource-to-learn-about-distributed-systems)\n\n介绍: 分布式系统学习资源.\n\n* [《What are some high performance TCP hacks?》](https://www.quora.com/What-are-some-high-performance-TCP-hacks)\n\n介绍: 一些高性能TCP黑客技巧.\n\n* [《Maintaining performance in distributed systems》](https://speakerdeck.com/elasticsearch/maintaining-performance-in-distributed-systems)\n\n介绍:分布式系统性能提升.\n\n* [《A simple totally ordered broadcast protocol》](http://diyhpl.us/~bryan/papers2/distributed/distributed-systems/zab.totally-ordered-broadcast-protocol.2008.pdf)\n\n介绍:Benjamin Reed 和 Flavio P.Junqueira 所著论文,对Zab算法进行了介绍,zab算法是Zookeeper保持数据一致性的核心,在国内有很多公司都使用zookeeper做为分布式的解决方案.推荐与此相关的一篇文章[ZooKeeper’s atomic broadcast protocol: Theory and practice](http://www.tcs.hut.fi/Studies/T-79.5001/reports/2012-deSouzaMedeiros.pdf).\n\n* [《zFS - A Scalable Distributed File System Using Object Disk》](http://storageconference.us/2003/papers/29-Rodeh-zFS.pdf)\n\n介绍:可扩展的分布式文件系统ZFS,[The Zettabyte File System](https://users.soe.ucsc.edu/~scott/courses/Fall04/221/zfs_overview.pdf),[End-to-end Data Integrity for File Systems: A ZFS Case Study](http://research.cs.wisc.edu/adsl/Publications/zfs-corruption-fast10.pdf).\n\n* [《A Distributed Haskell for the Modern Web》](http://videlalvaro.github.io/2015/12/learning-about-distributed-systems.html)\n\n介绍:分布式Haskell在当前web中的应用.\n\n* [《Reasoning about Consistency Choices in Distributed Systems》](https://pages.lip6.fr/Marc.Shapiro/papers/CISE-POPL-2016.pdf)\n\n介绍:POPL2016的论文,关于分布式系统一致性选择的论述,[POPL所接受的论文](http://conf.researchr.org/track/POPL-2016/POPL-2016-papers#event-overview),github上已经有人[整理](https://github.com/gasche/popl2016-papers).\n\n* [《Paxos Made Simple》](http://research.microsoft.com/en-us/um/people/lamport/pubs/paxos-simple.pdf)\n\n介绍:Paxos让分布式更简单.[译文](http://dsdoc.net/paxosmadesimple/index.html).[参考阅读:关于Paxos的历史](http://duanple.blog.163.com/blog/static/709717672012112203543166/),[understanding Paxos part1](https://distributedthoughts.wordpress.com/2013/09/22/understanding-paxos-part-1/),[Understanding Paxos – Part 2](https://distributedthoughts.wordpress.com/2013/09/30/understanding-paxos-part-2/).[Quora: What is a simple explanation of the Paxos algorithm?](https://www.quora.com/Distributed-Systems-What-is-a-simple-explanation-of-the-Paxos-algorithm),[Tutorial Summary: Paxos Explained from Scratch](http://www.ux.uis.no/~meling/papers/2013-paxostutorial-opodis.pdf),[Paxos algorithm explained, part 1: The essentials](http://bogdan.pistol.gg/2014/04/30/paxos-algorithm-explained-part-1-the-essentials/),[Paxos algorithm explained, part 2: Insights](http://bogdan.pistol.gg/2014/10/20/paxos-algorithm-explained-part-2-insights/)\n\n* [《Consensus Protocols: Paxos》](http://the-paper-trail.org/blog/consensus-protocols-paxos/)\n\n介绍:分布式系统一致性协议:Paxos.[参考阅读:关于Paxos的历史](http://duanple.blog.163.com/blog/static/709717672012112203543166/)\n\n* [《Consensus on Transaction Commit》](http://research.microsoft.com/pubs/64636/tr-2003-96.pdf)\n\n介绍：事务提交的一致性探讨.\n\n* [《The Part-Time Parliaments》](http://research.microsoft.com/en-us/um/people/lamport/pubs/lamport-paxos.pdf)\n\n介绍:在《The Part-Time Parliament》中描述了基本协议的交互过程。在基本协议的基础上完善各种问题得到了最终的议会协议。 为了让人更容易理解《The Part-Time Parliament》中描述的Paxos算法，Lamport在2001发表了[《Paxos Made Simple》](http://research.microsoft.com/en-us/um/people/lamport/pubs/paxos-simple.pdf)，以更平直的口头语言描述了Paxos，而没有包含正式的证明和数学术语。[《Paxos Made Simple》](http://research.microsoft.com/en-us/um/people/lamport/pubs/paxos-simple.pdf)中，将算法的参与者更细致的划分成了几个角色：Proposer、Acceptor、Learner。另外还有Leader和Client.[参考阅读:关于Paxos的历史](http://duanple.blog.163.com/blog/static/709717672012112203543166/)\n\n* [《Paxos Made Practical》](https://pdos.csail.mit.edu/archive/6.824-2007/papers/mazieres-paxos.pdf)\n\n介绍:看这篇论文时可以先看看[理解Paxos Made Practical](http://blog.csdn.net/bluecloudmatrix/article/details/41138363).\n\n* [《PaxosLease: Diskless Paxos for Leases》](http://arxiv.org/pdf/1209.4187.pdf)\n\n介绍：PaxosLease：实现租约的无盘Paxos算法,[译文](http://dsdoc.net/paxoslease/index.html).\n\n* [《Paxos Made Moderately Complex》](https://people.csail.mit.edu/matei/courses/2015/6.S897/readings/paxos-moderately-complex.pdf)\n\n介绍：[Paxos算法](http://paxos.systems/)实现,[译文](http://dsdoc.net/paxosmademoderatelycomplex/index.html),同时推荐[42 Paxos Made Moderately Complex](http://www.cs.cornell.edu/courses/cs7412/2011sp/paxos.pdf).\n\n* [《Hadoop Reading List》](http://duanple.blog.163.com/blog/static/7097176720119791920962/)\n\n介绍：Hadoop学习清单.\n\n* [《Hadoop Reading List》](http://duanple.blog.163.com/blog/static/7097176720119791920962/)\n\n介绍：Hadoop学习清单.\n\n* [《2010 NoSQL Summer Reading List》](http://www.empiricalreality.com/2010/09/22/2010-nosql-summer-reading-list/)\n\n介绍：NoSQL知识清单,里面不仅仅包含了数据库阅读清单还包含了分布式系统资料.\n\n* [《Raft: In search of an Understandable Consensus Algorithm》](https://raft.github.io/raft.pdf)\n\n介绍：raft 是一种用来管理日志复制的一致性算法。它和 Paxos 的性能和功能是一样的，但是它和 Paxos 的结构不一样；这使得 Raft 更容易理解并且更易于建立实际的系统。[中文版](http://www.infoq.com/cn/articles/raft-paper). [](https://github.com/pingcap/raft-rs)\n\n* [《Raft: Understandable Distributed Consensus》](http://thesecretlivesofdata.com/raft/)\n\n介绍：Raft可视化图帮助理解分布式一致性\n\n* [《Etcd:Distributed reliable key-value store for the most critical data of a distributed system》](https://github.com/coreos/etcd)\n\n介绍：Etcd分布式Key-Value存储引擎\n\n* [《Understanding Availability》](http://sysnet.ucsd.edu/recall/papers/iptps.pdf)\n\n介绍：理解peer-to-peer系统中的可用性究竟是指什么.同时推荐[基于 Peer-to-Peer 的分布式存储系统的设计](http://www.jos.org.cn/1000-9825/15/268.pdf)\n\n* [《Process structuring, synchronization, and recovery using atomic actions》](http://courses.cs.vt.edu/~cs5204/fall07-kafura/Papers/TransactionalMemory/Lomet.pdf)\n\n介绍：经典论文\n\n* [《Programming Languages for Parallel Processing》](http://www.eng.auburn.edu/files/file1358.pdf)\n\n介绍：并行处理的编程语音\n\n* [《Analysis of Six Distributed File Systems》](https://hal.inria.fr/hal-00789086/file/a_survey_of_dfs.pdf)\n\n介绍：此篇论文对HDFS,MooseFS,iRODS,Ceph,GlusterFS,Lustre六个存储系统做了详细分析.如果是自己研发对应的存储系统推荐先阅读此篇论文\n\n* [《A Survey of Distributed File Systems》](http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=A106388C6F04609BCA27DE6DF9C917A6?doi=10.1.1.35.4793&rep=rep1&type=pdf)\n\n介绍：分布式文件系统综述\n\n* [《Concepts of Concurrent Programming》](https://resources.sei.cmu.edu/asset_files/CurriculumModule/1990_007_001_15815.pdf)\n\n介绍：并行编程的概念,同时推荐[卡内基梅隆工程师数字图书馆](https://resources.sei.cmu.edu/library/)\n\n* [《Concurrency Control Performance Modeling:Alternatives and Implications》](https://www.cs.berkeley.edu/~brewer/cs262/ConcControl.pdf)\n\n介绍：并发控制性能建模：选择与意义\n\n* [《Distributed Systems - Concepts and Design 5th Edition》](https://azmuri.files.wordpress.com/2013/09/george-coulouris-distributed-systems-concepts-and-design-5th-edition.pdf)\n\n介绍：ebook分布式系统概念与设计\n\n* [《分布式系统设计的形式方法》](http://read.pudn.com/downloads51/ebook/174460/03.pdf)\n\n介绍：分布式系统设计的形式方法\n\n* [《互斥和选举算法》](http://read.pudn.com/downloads51/ebook/174460/04.pdf)\n\n介绍：互斥和选举算法\n\n* [《Actors：A model Of Concurrent Cornputation In Distributed Systems》](https://www.cypherpunks.to/erights/history/actors/AITR-844.pdf)\n\n介绍：经典论文\n\n* [《Security Engineering: A Guide to Building Dependable Distributed Systems》](https://www.cl.cam.ac.uk/~rja14/Papers/)\n\n介绍：如何构建一个安全可靠的分布式系统,[About the Author](https://www.cl.cam.ac.uk/~rja14/Papers/SEv2-acks.pdf),[Bibliography:文献资料](https://www.cl.cam.ac.uk/~rja14/Papers/SEv2-biblio.pdf),章节访问把[链接](https://www.cl.cam.ac.uk/~rja14/Papers/SEv2-c01.pdf)最后的01换成01-27即可\n\n* [《15-712 Advanced and Distributed Operating Systems》](https://www.cs.cmu.edu/~15712/index.html)\n\n介绍：卡内基梅隆大学的分布式系统博士生课程主页,有很丰富的[资料](https://www.cs.cmu.edu/~15712/syllabus.html)\n\n* [《Dapper, Google's Large-Scale Distributed Systems Tracing Infrastructure》](http://static.googleusercontent.com/media/research.google.com/zh-CN//archive/papers/dapper-2010-1.pdf)\n\n介绍：Dapper，大规模分布式系统的跟踪系统,[译文](http://bigbully.github.io/Dapper-translation/),[译文对照](http://dirlt.com/dapper.html)\n\n* [《CS262a: Advanced Topics in Computer Systems》](http://www.cs.berkeley.edu/~brewer/cs262/)\n\n介绍：伯克利大学计算机系统进阶课程,内容有深度,涵盖分布式,数据库等内容\n\n* [《Egnyte Architecture: Lessons Learned In Building And Scaling A Multi Petabyte Distributed System》](http://highscalability.com/blog/2016/2/15/egnyte-architecture-lessons-learned-in-building-and-scaling.html)\n\n介绍：PB级分布式系统构建/扩展经验\n\n* [《CS162: Operating Systems and Systems Programming》](https://cs162.eecs.berkeley.edu/)\n\n介绍：伯克利大学计算机系统课程:操作系统与系统编程\n\n* [《MDCC: Multi-Data Center Consistency》](http://mdcc.cs.berkeley.edu/)\n\n介绍：MDCC主要解决跨数据中心的一致性问题中间件,一种新的协议\n\n* [《Research at Google:Distributed Systems and Parallel Computing》](http://research.google.com/pubs/DistributedSystemsandParallelComputing.html)\n\n介绍：google公开对外发表的分布式系统与并行计算论文\n\n* [《HDFS Architecture Guide》](https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html)\n\n介绍：分布式文件系统HDFS架构\n\n* [《ActorDB distributed SQL database》](http://www.actordb.com/index.html)\n\n介绍：分布式 Key/Value数据库\n\n* [《An efficient data location protocol for self-organizing storage clusters》](http://csc.lsu.edu/~gb/csc7700/Reading/SC03_tang.pdf)\n\n介绍：是著名的[Ceph](https://github.com/ceph/ceph)的负载平衡策略，文中提出的几种策略都值得尝试，比较赞的一点是可以对照代码体会和实践,如果你还需要了解可以看看[Ceph:一个 Linux PB 级分布式文件系统](https://www.ibm.com/developerworks/cn/linux/l-ceph/),除此以外,论文的引用部分也挺值得阅读的,同时推荐[Ceph: A Scalable, High-Performance Distributed File System](http://ceph.com/papers/weil-ceph-osdi06.pdf)\n\n* [《A Self-Organizing Storage Cluster for Parallel Data-Intensive Applications》](http://www.supercomputing.org/sc2004/schedule/pdfs/pap283.pdf)\n\n介绍：Surrento的冷热平衡策略就采用了延迟写技术\n\n* [《HBA: Distributed Metadata Management for Large Cluster-Based Storage Systems》](http://www.sersc.org/journals/IJAST/vol36/4.pdf)\n\n介绍：对于分布式存储系统的元数据管理.\n\n* [《Server-Side I/O Coordination for Parallel File Systems》](http://www.mcs.anl.gov/~thakur/papers/sc11-io.pdf)\n\n介绍：服务器端的I/O协调并行文件系统处理,网络,文件存储等都会涉及到IO操作.不过里面涉及到很多技巧性的思路在实践时需要斟酌\n\n* [《Distributed File Systems: Concepts and Examples》](http://www.cs.virginia.edu/~zaher/classes/CS656/levy.pdf)\n\n介绍：分布式文件系统概念与应用\n\n* [《CSE 221: Graduate Operating Systems》](http://cseweb.ucsd.edu/classes/wi08/cse221/)\n\n介绍：加利福尼亚大学的研究生操作系统课程主页，论文很值得阅读\n\n* [《S4: Distributed Stream Computing Platform》](http://cs.brown.edu/~debrabant/cis570-website/papers/s4.pdf)\n\n介绍：Yahoo出品的流式计算系统，目前最流行的两大流式计算系统之一（另一个是storm），Yahoo的主要广告计算平台\n\n* [《Pregel: a system for large-scale graph processing》](https://kowshik.github.io/JPregel/pregel_paper.pdf)\n\n介绍：Google的大规模图计算系统，相当长一段时间是Google PageRank的主要计算系统，对开源的影响也很大（包括GraphLab和GraphChi）\n\n* [《GraphLab: A New Framework for Parallel Machine Learning》](http://www.select.cs.cmu.edu/publications/paperdir/uai2010-low-gonzalez-kyrola-bickson-guestrin-hellerstein.pdf)\n\n介绍：CMU基于图计算的分布式机器学习框架，目前已经成立了专门的商业公司，在分布式机器学习上很有两把刷子，其单机版的GraphChi在百万维度的矩阵分解都只需要2~3分钟；\n\n* [《F1: A Distributed SQL Database That Scales》](http://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41344.pdf)\n\n介绍：这篇论文是Google 2013年发表的，介绍了F1的架构思路，13年时就开始支撑Google的AdWords业务，另外两篇介绍文章[F1 - The Fault-Tolerant Distributed RDBMS Supporting Google's Ad Business ](http://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/38125.pdf).[Google NewSQL之F1](http://www.leafonsword.org/google-f1/)\n\n* [《Cockroach DB:A Scalable, Survivable, Strongly-Consistent SQL Database》](https://github.com/cockroachdb/cockroach)\n\n介绍：CockroachDB ：一个可伸缩的、跨地域复制的，且支持事务的数据存储,[InfoQ介绍](http://www.infoq.com/cn/news/2014/08/CockroachDB),[Design and Architecture of CockroachDb](https://www.gitbook.com/book/smazumder05/design-and-architecture-of-cockroachdb/details)\n\n* [《Multi-Paxos: An Implementation and Evaluation》](ftp://ftp.cs.washington.edu/tr/2009/09/UW-CSE-09-09-02.PDF)\n\n介绍：Multi-Paxos实现与总结，此外推荐[Paxos/Multi-paxos Algorithm](https://github.com/cocagne/multi-paxos-example),[Multi-Paxos Example](https://github.com/cocagne/multi-paxos-example)，地址:ftp://ftp.cs.washington.edu/tr/2009/09/UW-CSE-09-09-02.PDF\n\n* [《Zab: High-performance broadcast for primary-backup systems》](http://web.stanford.edu/class/cs347/reading/zab.pdf)\n\n介绍：一致性协议zab分析\n\n* [《A Distributed Hash Table》](https://pdos.csail.mit.edu/papers/fdabek-phd-thesis.pdf)\n\n介绍：分布式哈希算法论文,扩展阅读[Introduction to Distributed Hash Tables](https://www.ietf.org/proceedings/65/slides/plenaryt-2.pdf),[Distributed Hash Tables](https://www.cs.cmu.edu/~dga/15-744/S07/lectures/16-dht.pdf)\n\n* [《Comparing the performance of distributed hash tables under churn》](http://www.news.cs.nyu.edu/~jinyang/pub/iptps04.pdf)\n\n介绍：分布式hash表性能的Churn问题\n\n* [《Brewer’s Conjecture and the Feasibility of Consistent, Available, Partition-Tolerant Web》](https://www.comp.nus.edu.sg/~gilbert/pubs/BrewersConjecture-SigAct.pdf)\n\n介绍：分布式系统的CAP问题,推荐[Perspectives on the CAP Theorem](https://groups.csail.mit.edu/tds/papers/Gilbert/Brewer2.pdf).对CAP理论的解析文章,[PODC ppt](http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC-keynote.pdf),[A plain english introduction to CAP Theorem](http://ksat.me/a-plain-english-introduction-to-cap-theorem/),[IEEE Computer issue on the CAP Theorem](http://dbmsmusings.blogspot.kr/2012/10/ieee-computer-issue-on-cap-theorem.html)\n\n* [《F2FS: A New File System for Flash Storage》](https://www.usenix.org/system/files/conference/fast15/fast15-paper-lee.pdf)\n\n介绍：闪存存储文件系统F2FS\n\n* [《Better I/O Through Byte-Addressable, Persistent Memory》](http://research.microsoft.com/pubs/81175/BPFS.pdf)\n\n介绍：微软发表的关于i/o访问优化论文\n\n* [《tmpfs: A Virtual Memory File System》](http://www.solarisinternals.com/si/reading/tmpfs.pdf)\n\n介绍：虚拟内存文件系统tmpfs\n\n* [《BTRFS: The Linux B-tree Filesystem》](http://domino.research.ibm.com/library/cyberdig.nsf/papers/6E1C5B6A1B6EDD9885257A38006B6130/$File/rj10501.pdf)\n\n介绍：Linux B-tree文件系统.\n\n* [《Akamai technical publication》](https://www.akamai.com/us/en/our-thinking/technical-publications.jsp)\n\n介绍：Akamai是全球最大的云计算机平台之一，承载了全球15-30%网络流量,如果你是做CDN或者是云服务,这个里面的论文会给你很有帮助.例如这几天看facebook开源的[osquery](https://osquery.io/)。找到通过db的方式运维,找到[Keeping Track of 70,000+ Servers: The Akamai Query System](https://www.akamai.com/es/es/multimedia/documents/technical-publication/keeping-track-of-70000-servers-the-akamai-query-system-technical-publication.pdf)这篇论文，先看论文领会思想，然后再使用工具osquery实践\n\n* [《BASE: An Acid Alternative》](http://dl.acm.org/citation.cfm?id=1394128)\n\n介绍：来自eBay 的解决方案,译文[Base: 一种Acid的替代方案](http://article.yeeyan.org/view/167444/125572),应用案例参考[保证分布式系统数据一致性的6种方案](https://mp.weixin.qq.com/s?__biz=MzAwMDU1MTE1OQ==&mid=2653546976&idx=1&sn=c3fb2338389a41e7ab998c0c21bd3e5d)\n\n* [《A Note on Distributed Computing》](http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=CF3CA7E7B62091EB266A1543A6F2D26A?doi=10.1.1.41.7628&rep=rep1&type=pdf)\n\n介绍：Jim Waldo和Sam Kendall等人共同撰写了一篇非常有名的论文“分布式计算备忘录”，这篇论文在Reddit上被人推荐为“每个程序员都应当至少读上两篇”的论文。在这篇论文中，作者表示“忽略本地计算与分布式计算之间的区别是一种危险的思想”，特别指出了Emerald、Argus、DCOM以及CORBA的设计问题。作者将这些设计问题归纳为“三个错误的原则”： “对于某个应用来说，无论它的部署环境如何，总有一种单一的、自然的面向对象设计可以符合其需求。” “故障与性能问题与某个应用的组件实现直接相关，在最初的设计中无需考虑这些问题。” “对象的接口与使用对象的上下文无关”.\n\n* [《Distributed Systems Papers》](https://github.com/papers-we-love/papers-we-love/tree/master/distributed_systems)\n\n介绍：分布式系统领域经典论文列表.\n\n* [《Consistent Hashing and Random Trees: Distributed Caching Protocols for Relieving Hot Spots on the World Wide Web》](https://www.akamai.com/es/es/multimedia/documents/technical-publication/consistent-hashing-and-random-trees-distributed-caching-protocols-for-relieving-hot-spots-on-the-world-wide-web-technical-publication.pdf)\n\n介绍：Consistent Hashing算法描述.\n\n* [《SIGMOD 2016: Accepted Research Papers》](http://sigmod2016.org/pods_list.shtml)\n\n介绍：SIGMOD是世界上最有名的数据库会议之一,最具有权威性,收录论文审核非常严格.2016年的SIGMOD 会议照常进行,上面收录了今年SIGMOD收录的论文,把题目输入google中加上pdf就能找到,很多论文值得阅读,[SIGMOD 2015](http://sigmod2015.org/pods_list.shtml)\n\n* [《Notes on CPSC 465/565: Theory of Distributed Systems》](http://www.cs.yale.edu/homes/aspnes/classes/465/notes.pdf)\n\n介绍:耶鲁大学的分布式系统理论课程笔记\n\n* [《Distributed Operating System Doc PDF》](http://listpdf.com/di/distributed-operating-system-doc-pdf.html)\n\n介绍:分布式系统文档资源（可下载）\n\n* [《Anatomy of a database system》](https://mitpress.mit.edu/sites/default/files/titles/content/9780262693141_sch_0002.pdf)\n\n介绍:数据库系统剖析，这本书是由伯克利大学的[Joseph M. Hellerstein](http://db.cs.berkeley.edu/jmh/)和M. Stonebraker合著的一篇论文.对数据库剖析很有深度.除此以外还有一篇文章[Architecture of a Database System](http://db.cs.berkeley.edu/papers/fntdb07-architecture.pdf)。数据库系统架构,厦门大学的数据库实验室教授林子雨组织过[翻译](http://dblab.xmu.edu.cn/sites/default/files/files/linziyu-Architecture%20of%20a%20Database%20System(Chinese%20Version)-ALL.pdf)\n\n* [《A Relational Model of Data for Large Shared Data Banks》](https://www.seas.upenn.edu/~zives/03f/cis550/codd.pdf)\n\n介绍:数据库关系模型论文\n\n* [《RUC Innovative data systems reaserch lab recommand papers》](http://idke.ruc.edu.cn/reading/index.htm)\n\n介绍:中国人民大学数据研究实验室推荐的数据库领域论文\n\n* [《A Scalable Distributed Information Management System》](http://www.cs.utexas.edu/~dahlin/projects/sdims/papers/sdims-sigcomm.pdf)\n\n介绍:构建可扩展的分布式信息管理系统\n\n* [《Distributed Systems in Haskell》](http://yager.io/Distributed/Distributed.html)\n\n介绍:Haskell中的分布式系统开发\n\n* [《Large-scale cluster management at Google with Borg》](research.google.com/pubs/archive/43438.pdf)\n\n介绍:Google使用Borg进行大规模集群的管理,[伯克利大学ppt介绍](http://people.eecs.berkeley.edu/~istoica/classes/cs294/15/notes/09-borg.pdf),[中文版](https://ying-zhang.github.io/cloud/2017/eurosys15-borg-cn/)\n\n* [《Lock Free Programming Practice》](http://www.yebangyu.org/LockFreeProgrammingPractice.pdf)\n\n介绍:并发编程（Concurrency Programming）资料,主要涵盖lock free数据结构实现、内存回收方法、memory model等[备份链接](http://pan.baidu.com/s/1sleTpgT) 密码: xc5j\n\n* [《Distributed Algorithms Lecture Notes for 6.852》](http://read.pudn.com/downloads95/ebook/386159/Distributed.Algorithms.pdf)\n\n介绍:Nancy Lynch's的分布式算法研究生课程讲义\n\n* [《Distributed Algorithms for Topic Models》](http://www.jmlr.org/papers/volume10/newman09a/newman09a.pdf)\n\n介绍:分布式算法主题模型.\n\n* [《RecSys - ACM Recommender Systems》](https://recsys.acm.org/)\n\n介绍:世界上非常有名的推荐系统会议，我比较推荐接收的[PAPER](https://recsys.acm.org/recsys16/accepted-contributions)\n\n* [《All Things Distributed》](http://www.allthingsdistributed.com/)\n\n介绍:推荐一个博客,博主是Amazon CTO Werner Vogels,这是一个关注分布式领域的博客.大部分博文是关于在工业界应用.\n\n* [《programming, database, distributed system resource list》](https://github.com/hedengcheng/tech)\n\n介绍:这个Git是由阿里(alibaba)的技术专家何登成维护,主要是分布式数据库.\n\n* [《Making reliable distributed systems in the presence of sodware errors》](http://erlang.org/download/armstrong_thesis_2003.pdf)\n\n介绍:Erlang的作者[Joe Armstrong](http://joearms.github.io/)撰写的论文，面对软件错误构建可靠的分布式系统.[中文译版](http://open.qiniudn.com/[Joe-Armstrong][CN]Making-reliable-distributed-systems-in-the-presence-of-software-errors.pdf)\n\n* [《CS 525: Advanced Distributed Systems[Spring 2018]》](https://courses.engr.illinois.edu/cs525/sp2018/sched.htm)\n\n介绍:伊利诺伊大学的Advanced Distributed Systems 里把各个方向重要papers（updated Spring 2015）列举出来，可以参考一下\n\n* [《Distributed Algorithms》](https://users.ics.aalto.fi/suomela/da/da-screen.pdf)\n\n介绍:这是一本分布式算法电子书,作者是[Jukka Suomela](https://users.ics.aalto.fi/suomela/da/).讲述了多个计算模型,一致性,唯一标示,并发等.\n\n* [《TinyLFU: A Highly Efficient Cache Admission Policy》](https://arxiv.org/pdf/1512.00727v2.pdf)\n\n介绍:当时是在阅读[如何设计一个缓存系统](http://blog.gainlo.co/index.php/2016/05/17/design-a-cache-system/)时看到的，然后通过Google找到了这一篇关于缓存策略的论文，它是LFU的改良版,中文[介绍](http://chuansong.me/n/2254051).如果有兴趣可以看看[Golang实现版](https://github.com/dgryski/go-tinylfu)。结合起来可能会帮助你理解\n\n* [《6.S897: Large-Scale Systems》](https://cs.stanford.edu/~matei/courses/2015/6.S897/)\n\n介绍:斯坦福大学给研究生开的分布式系统课程。教师是 spark 作者 matei. 能把这些内容真正理解透，分布式系统的功力就很强了。\n\n* [《学习分布式系统需要怎样的知识？》](https://www.zhihu.com/question/23645117/answer/124708083)\n\n介绍:[怎么学系列]学习分布式系统需要怎样的知识？\n\n* [《Distributed systems theory for the distributed systems engineer》](http://the-paper-trail.org/blog/distributed-systems-theory-for-the-distributed-systems-engineer/)\n\n介绍:分布式系统工程师的分布式系统理论\n\n* [《A Distributed Systems Reading List》](https://dancres.github.io/Pages/)\n\n介绍:分布式系统论文阅读列表,此外推荐威斯康星大学麦迪逊分校计算机系分布式系统学习推荐[阅读列表](http://pages.cs.wisc.edu/~swift/classes/cs739-fa14/wiki/pmwiki.php/Main/ReadingList)\n\n* [《Distributed Systems Reading Group》](http://dsrg.pdos.csail.mit.edu/papers/)\n\n介绍:麻省理工大学分布式系统小组，他们会把平时阅读到的优秀论文分享出来。虽然有些论文本页已经收录，但是里面的安排表[schedule](http://dsrg.pdos.csail.mit.edu/schedule/)还是挺赞的\n\n* [《Scalable Software Architecture》](https://github.com/Developer-Y/Scalable-Software-Architecture)\n\n介绍:分布式系统、可扩展性与系统设计相关报告、论文与网络资源汇总.\n\n* [《MapReduce&Hadoop resource》](http://barbie.uta.edu/~jli/Resources/MapReduce&Hadoop/)\n\n介绍:MapReduce&Hadoop相关论文，涉及分布式系统设计，性能分析，实践，优化等多个方面\n\n* [《Distributed Systems: Principles and Paradigms(second edtion)》](https://vowi.fsinf.at/images/b/bc/TU_Wien-Verteilte_Systeme_VO_(G%C3%B6schka)_-_Tannenbaum-distributed_systems_principles_and_paradigms_2nd_edition.pdf)\n\n介绍:分布式系统原理与范型第二版,[课后解答](http://barbie.uta.edu/~jli/Resources/MapReduce&Hadoop/distributed%20systems%20principles%20and%20paradigms%20solution.pdf)\n\n* [《Distributed Systems Seminar's reading list for Spring 2017》](http://muratbuffalo.blogspot.jp/2016/11/my-distributed-systems-seminars-reading.html)\n\n介绍:分布式系统研讨会论文阅读列表\n\n* [《A Critique of the CAP Theorem》](https://arxiv.org/abs/1509.05393)\n\n介绍:这是一篇评论CAP定理的论文，学习CAP很有帮助,推荐阅读评论文章[\"A Critique of the CAP Theorem\"](https://jvns.ca/blog/2016/11/19/a-critique-of-the-cap-theorem/)\n\n* [《Evolving Distributed Systems》](http://olivergierke.de/2016/10/evolving-distributed-systems/)\n\n介绍:推荐文章《不断演进的分布式系统》.\n\n* [《Ask HN: Recommendations for a book on Distributed Systems?》](https://news.ycombinator.com/item?id=13311124)\n\n介绍:HN上面关于分布式系统相关领域学习的书籍推荐.\n\n* [《SeaweedFS:A simple and highly scalable distributed file system》](https://github.com/chrislusf/seaweedfs)\n\n介绍:Golang开源项目,分布式文件存储系统SeaweedFS\n\n* [《The Design and Implementation of a Log-Structured File System》](https://web.stanford.edu/~ouster/cgi-bin/papers/lfs.pdf)\n\n介绍:论文推荐:设计并实现一个日志结构的文件系统.\n\n* [《DATABASE SYSTEMS》](http://15721.courses.cs.cmu.edu/spring2016/papers/garciamolina-tkde1992.pdf)\n\n介绍:数据库系统的设计与实现，卡内基梅隆大学在2016年春季数据库课程以本书作为教材,并且向外界开放了[Schedule](http://15721.courses.cs.cmu.edu/spring2016/schedule.html).引用一段亚马逊上面的购书评论:\n\n    这本书主要集中在基本的数据库实现方面。看起来很理论，但实际上作者提到的点都有实际的考虑。这一点在写完相关代码后重新阅读感触尤深。但如果不经过自己的思考和实践，这本书实际上读起来仍是“看起来就是那么回事”的感觉。\n\n    不得不说，这本书其实应该是所有进行数据库应用开发的人必读的一本书。大部分数据库里面的概念，书本都有从实际的需求中引导出，一目了然。大部分的教材，在提到数据库的各种概念时，往往是有定义而无解释为何有这种定义。\n\n* [《Don't settle for eventual consistency》](https://yokota.blog/2017/02/17/dont-settle-for-eventual-consistency/)\n\n介绍:原文主要讲述了CAP理论中C在实践中的重要性。做分布式系统的都知道CAP只能三选其二。而且目前很多基础设置服务（云存储，云数据）都无法保证100%可用，那么就是间接的丢掉了A，推荐阅读以下文末推荐的[You Can’t Sacrifice Partition Tolerance](https://codahale.com/you-cant-sacrifice-partition-tolerance/)，分区容错也很重要\n\n* [《Verdi:Formally Verifying Distributed Systems》](http://verdi.uwplse.org/)\n\n介绍:Verdi是一套正规验证分布式系统，开源的项目中有对raft协议实现。Verdi是通过TLA+ 和Coq 等形式方法对系统进行验证\n\n* [《What are the knowledge required to learn distributed system》](https://www.zhihu.com/question/23645117)\n\n介绍:学习分布式系统需要怎样的知识?\n\n* [《TAO: Facebook’s Distributed Data Store for the Social Graph》](https://www.usenix.org/system/files/conference/atc13/atc13-bronson.pdf)\n\n介绍:Facebook设计的分布式数据 图数据库\n\n* [《Resources for Getting Started with Distributed Systems》](https://caitiem.com/2017/09/07/getting-started-with-distributed-systems/)\n\n介绍:分布式系统初学者资源.\n\n* [《Building a Distributed Log from Scratch, Part 1: Storage Mechanics》](https://bravenewgeek.com/building-a-distributed-log-from-scratch-part-1-storage-mechanics/)\n\n介绍:从0开始构建一个分布式日志。第一部分主要是讲日志的存储，截止到现在已经写到[数据复制](https://bravenewgeek.com/building-a-distributed-log-from-scratch-part-2-data-replication/)、[扩容之日志消耗](https://bravenewgeek.com/building-a-distributed-log-from-scratch-part-3-scaling-message-delivery/)、[权衡与思考](https://bravenewgeek.com/building-a-distributed-log-from-scratch-part-4-trade-offs-and-lessons-learned/)、[快速实战](https://bravenewgeek.com/building-a-distributed-log-from-scratch-part-5-sketching-a-new-system/)。另外推荐作者写的[现实世界中的分布式系统推论](https://bravenewgeek.com/from-the-ground-up-reasoning-about-distributed-systems-in-the-real-world/)\n\n* [《CS 525 Spring 2018 Advanced Distributed Systems》](https://courses.engr.illinois.edu/cs525/sp2018/index.html)\n\n介绍:伊利诺伊大学分布式系统进阶课程，涉及内容云的前世今生，大公司的在分布式计算上的工作（Mapreduce参考）、P2P系统滚、KV存储、基本的分布式算法（时钟同步，锁）、强一致性、分布式在机器学习上的应用、流处理、认证、事务处理、存储与复制、最终一致性、图处理、集群调度、分布式系统bug跟踪和性能测试、安全、缓存。\n\n* [《Notes on Distributed Systems for Young Bloods》](https://www.somethingsimilar.com/2013/01/14/notes-on-distributed-systems-for-young-bloods/)\n\n介绍:这篇文章没有理论，适合新手阅读分布式系统实践笔记\n\n* [《Design patterns for container-based distributed systems》](https://www.usenix.org/system/files/conference/hotcloud16/hotcloud16_burns.pdf)\n\n介绍:基于容器的分布式系统设计模式，文中提到了，单容器模式，所有的服务都集成在一个容器里面。单节点多容器模式，类似于kubernetes的Pods（任务组）。一个服务跨多个容器。对于这种模式可以分为Sidecar模式:譬如一个Web服务。Web由一个容器提供，日志处理由一个Logsaver容器提供。Ambassador模式（外交官模式）类似于SLB的设计模式，中间有一个代理容器用来分发功能到子容器。Adapter模式（适配器模式）主要是目的是想分布的执行和存储，统一的监控和管理。有点类似监控系统的设计，日志数据的输入不一，但是统一结果输出。多节点应用模式：这个分为选主模式（核心是选主算法）。Work Queue模式（工作队列模式）类似大规模电商系统的订单处理设计。Scatter/gather模式：有点类似MapRedue架构，分片处理，最后汇总结果。文章推荐[容器设计模式](http://www.infoq.com/cn/articles/kubernetes-and-cloud-native-app-container-design-pattern)\n\n* [《Making The Case For Building Scalable Stateful Services In The Modern Era》](http://highscalability.com/blog/2015/10/12/making-the-case-for-building-scalable-stateful-services-in-t.html)\n\n介绍: 在处理分布式系统的时候，很多经验告诉我们要尽量让服务无状态。而在实际分布式系统中，有状态的服务是一致存在的。例如消息队列、数据库存储服务。本文介绍了如何构建有状态的服务，如果保证有状态化服务的高可用。\n\n* [《LHD: Improving Cache Hit Rate by Maximizing Hit Density》](http://www.cs.cmu.edu/~beckmann/publications/papers/2018.nsdi.lhd.pdf)\n\n介绍:使用Maximizing Hit Density提高缓存命中.\n\n* [《Principles Of Chaos Engineering》](http://principlesofchaos.org/)\n\n介绍:混沌工程是在分布式系统上进行实验的学科, 目的是建立对系统抵御生产环境中失控条件的能力以及信心。\n大规模分布式软件系统的发展正在改变软件工程。作为一个行业，我们很快采用了提高开发灵活性和部署速度的实践。紧跟着这些好处的一个紧迫问题是：我们对投入生产的复杂系统中有多少信心？\n\n* [《The Paxos Algorithm》](https://www.youtube.com/watch?v=d7nAGI_NZPk)\n\n介绍:Google SRE 讲解分布式系统Paxos算法。\n\n* [《Time Series Database Lectures 》](https://db.cs.cmu.edu/seminar2017/)\n\n介绍:[Andy Pavlo](http://www.cs.cmu.edu/~pavlo/)组织的时序数据库系列演讲分享,InfluxDB存储引擎、QuasarDB内部剖析、TimescaleDB成长、Two Sigma时序数据库实践。\n\n* [《Andy CMU course：Advanced Database Systems》](https://15721.courses.cs.cmu.edu/spring2017/schedule.html)\n\n介绍:[Andy Pavlo](http://www.cs.cmu.edu/~pavlo/)在卡内基梅隆大学的高级数据库课程，以论文导读的形式。有[视频](https://www.youtube.com/playlist?list=PLSE8ODhjZXjYgTIlqf4Dy9KQpQ7kn1Tl0)。并发控制，乐观并发控制、多版本并发控制、OLAP索引、数据库压缩、存储模型、日志协议、检查点协议、优化器的实现、执行计划、并行join、查询编译、内存数据库.\n\n* [《CASPaxos: Replicated State Machines without logs》](https://arxiv.org/abs/1802.07000)\n\n介绍:这篇论文是Paxos算法变种，规避了Paxos算法的复杂性。同时达到了RSM的高性能要求。[github](https://github.com/rystsov/caspaxos) 上有开发者对这个算法进行了总结。已经有多种语言的实现方式。譬如Js和Golang版本的实现.\n\n* [《Facebook Immune System》](https://css.csail.mit.edu/6.858/2012/readings/facebook-immune.pdf)\n\n介绍:Facebook反作弊系统论文。\n\n* [《Logical Physical Clocks and Consistent Snapshots in Globally Distributed Databases》](https://cse.buffalo.edu/tech-reports/2014-04.pdf)\n\n介绍:混合逻辑时钟。\n\n* [《Riffle: optimized shuffle service for large-scale data analytics》](https://dl.acm.org/citation.cfm?id=3190534)\n\n介绍:Riffle：大规模分布式系统中的数据分析优化。\n\n* [《Omega: flexible, scalable schedulers for large compute clusters》](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41684.pdf)\n\n介绍:本文描述了Google第二代容器化调度服务Omega的设计与诞生。作者也有一份[keynote](https://people.csail.mit.edu/malte/pub/talks/2013-04-17_eurosys-omega.pdf)。相关介绍[视频](https://www.youtube.com/watch?v=Zf__a9ReiPE)\n\n* [《Large-scale Incremental Processing Using Distributed Transactions and Notifications》](http://notes.stephenholiday.com/Percolator.pdf)\n\n介绍:Percolator号称其取代MapReduce之后，Google的索引更新速度提升了100倍。它究竟是如何实现 “100” 这个刺眼的数字？当今的并行计算世界真的有如此大的提升空间吗？当我们满心欢喜以为又有新的算法、新的并行计算架构可以学习时，她却又为何跟你聊起了分布式事务？这篇文章将为您揭晓。[中文版](http://www.importnew.com/2896.html)\n\n* [《Designing Data-Intensive Applications》](http://dataintensive.net/)\n\n介绍:设计数据密集型应用是一本讲述分布式系统的数据，作者是卡内基梅隆大学的研究员。本书的质量很高。详细讲述各种数据存储，包括关系型数据库、NoSQL、大数据存储、流处理系统等等，由浅入深、拨丝抽茧.适合给刚刚步入分布式系统大门的朋友.[简译版](https://vonng.gitbooks.io/ddia-cn/content/)\n\n* [《CSE 552 Fall 2013 Lecture Topics》](https://courses.cs.washington.edu/courses/cse552/13au/calendar/lecturelist.html)\n\n介绍:华盛顿大学分布式系统课程，老师是Tom Anderson。\n\n* [《Kafka: a Distributed Messaging System for Log Processing》](http://notes.stephenholiday.com/Kafka.pdf)\n\n介绍:这篇论文是Kafka的开发团队所著，讲述Kafka的设计和架构，在Linkedin中应用以及性能评估，相当于是消息系统领域的\"GFS\"论文。\n\n* [《Workload Analysis of a Large-Scale Key-Value Store》](http://www.ece.eng.wayne.edu/~sjiang/pubs/papers/atikoglu12-memcached.pdf)\n\n介绍:这篇论文分析facebook在大规模使用Memcached的应用经验。如果高效的在分布式系统中利用缓存。通过缓存系统，研究员可以像tcpdump一样保存请求进行数据分析。如果是遇到大规模缓存使用的场景还是挺值得阅读。\n\n* [《F4: Facebook's Warm BLOB Storage System》](https://www.usenix.org/system/files/conference/osdi14/osdi14-paper-muralidhar.pdf)\n\n介绍:F4 是 Facebook 为了降低存储成本而开发的，应用于只读可删除不可写场景的，对象存储系统。F4是建立在HDFS上，并阐述了它是如何应对HDFS的几处局限（即，增加了cross-data center replication和使用纠删码来减少复制因子）。通常，Facebook开发一个系统，都是非常实用的，都是为他们真实的使用案例量身打造的。\n\n* [《Towards Optimization-Safe Systems: Analyzing the Impact of Undefined Behavior》](http://www.cs.cmu.edu/~15712/papers/wang13.pdf)\n\n介绍:这篇论文是[SOSP '13](https://www.sigops.org/s/conferences/sosp/2013/)的论文。描述了各种由于编译器优化导致的正常人很难发现的 Bug。下面摘录一篇[阅读笔记](https://github.com/dyweb/papers-notebook#bug):\n```\nUndefined behavior 是编程语言规范对某段代码可能产生的某些执行结果未定义。Unstable code 就是在程序实际的执行过程中，由于涉及到undefined behavior，从而无法被编译器翻译（直接略过）的代码段。\n\nSTACK会在Assumption Δ被允许和不允许的情况下分别模拟编译。\n\n先模拟假设不成立的情况进行一次编译；\n模拟假设成立的情况进行一次编译；\n查看前两步的执行结果有没有区别，有区别的地方就是 unstable code。\n如果执行第二步时得不到准确的结果，那么会漏报一些unstable code；如果执行第一步时得不到准确的结果，就会产生误报(false warning / false positive)。目前stack给出的Undefined behavior pattern 可能不齐全。\n\n对于程序员来说，通过fix bug或者去掉一些会被编译器当做是undefined behavior的代码；对于编译器来说，可以集成一些现有的bug-finding的工具，或者利用STACK的方式来判定unstable code；完善编程语言的specification，定义更多的代码执行规则，减少undefined behavior的产生。\n\nSTACK为了使可扩展性更高，在计算Δ = ∀e:Reach(e) → ¬Undef(e)的时候做了一些近似运算，使最后得到的结果可能会漏掉一些unstable code。STACK为了简化和滤过某些查询用到的constraint solver如果发生了timeout，也会出现漏报的情况。因此，STACK为了更好的扩展性，牺牲了一定的可靠性（精度）。\n```\n\n* [《The Tail At Scale》](https://cseweb.ucsd.edu/~gmporter/classes/fa17/cse124/post/schedule/p74-dean.pdf)\n\n介绍:Jeff Dean 2013年发表的文章，讲述当用户的请求依赖大规模分布式系统来协作完成时，如何保证请求的响应时间？。里面提到几个关键：任务拆分、区分定时任务和后台任务、服务间调用超时处理、热点数据多副本.\n\n* [《ZooKeeper: Wait-free coordination for Internet-scale systems》](https://www.usenix.org/legacy/event/atc10/tech/full_papers/Hunt.pdf)\n\n介绍: ZooKeeper是一个分布式协调组件，它提供了一系列的基本原语，增、删、读、监听。例如这些可以实现很多高级的原语。例如锁（Zookeeper部署锁服务）、配置管理、主从管理。本文主要讲述了它的设计、应用以及测试结果。其中也讲到了它的高可用问题，是Chubby的开源版本.\n\n* [《Amazon Aurora: Design Considerations for High Throughput Cloud-Native Relational Databases》](https://www.allthingsdistributed.com/files/p1041-verbitski.pdf)\n\n介绍:Amazon Aurora是NewSQL的代表作品之一，与[TiDB](https://github.com/pingcap/tidb)相比较有一些不同。不过两者都是为云而生的数据库，对横向伸缩天生的良好支持、failover。从论文中可以知道aurora通过log如何实现改善数据库的性能。Aurora的核心思想是尽可能的利用存储的性能，把计算节点下推到存储节点处理。\n\n- [《Consensus: Bridging Theory and Practice》](https://web.stanford.edu/~ouster/cgi-bin/papers/OngaroPhD.pdf)\n\n介绍：一致性：理论和实践。这篇是作者的博士论文，整篇论文围绕这个一致性相关主题展开。Raft算法基础、集群成员改变、客户端交互、Raft学习、验证、一致性实现和性能。作者把相关的公式和笔记放在[github](https://github.com/ongardie/dissertation/)\n\n- [《Performance Debugging for Distributed Systems of Black Boxes》](https://pdos.csail.mit.edu/~athicha/papers/blackboxes:sosp03.pdf)\n\n介绍：对分布式系统的性能Debug非常困难，因为里面的问题很多都是非确定性的，而且无法重现。只能通过对log的挖掘，找出配对的调用/消息以定位问题。黑盒方案假定需要跟踪的除了上述信息之外没有额外的信息，这样使用统计回归技术来推断两者之间的关系.与之相对应的Google使用标注方案解决Debug问题，具体参考[Dapper](https://storage.googleapis.com/pub-tools-public-publication-data/pdf/36356.pdf)\n\n- [《The Five-Minute Rule Ten Years Later, and Other Computer Storage Rules of Thumb》](http://jimgray.azurewebsites.net/5_min_rule_sigmod.pdf)\n\n介绍： 五分钟法则,此文与十年前的原始论文解释了一个量化公式，用来计算数据页是否应该缓存在内存中。能读到Jim Gray处理一系列相关问题（比如数据页应该多大）的方法，幸何如之。\n\n* [《CS-739: Distributed Systems》](http://pages.cs.wisc.edu/~remzi/Classes/739/Fall2018/)\n\n介绍:威斯康星大学分布式系统课程，主要以阅读为主：网络（TCP、RPC、U-net、Thrift、虚拟网络），系统失效、分布式时钟、一致性、资源隔离与分配、安全、负载均衡、集群调度、文件系统、案例学习.\n\n* [《Readings in Stream Processing》](https://github.com/xerial/streamdb-readings)\n\n介绍: 流处理相关论文阅读列表。可以深入理解消息队列\n\n* [《paper notebook of distributed system》](https://github.com/dyweb/papers-notebook)\n\n介绍: 分布式系统领域论文笔记。里面推荐了很多相关论文，譬如：调度器(Scheduler)、存储(Storage)、一致性算法、图计算、虚拟化、沙箱、安全、网络.现在这个列表转移到了[issue](https://github.com/dyweb/papers-notebook/issues)\n\n* [《Distributed tracing》](https://gianarb.it/blog/faq-distributed-tracing)\n\n介绍: 分布式系统跟踪，解释了为什么需要、跟踪什么、如何处理众多信息.\n\n* [《Dapr：Distributed Application Runtime》](https://github.com/dapr/dapr)\n\n介绍: 微软发布分布式应用程序运行时(Dapr)，这是一个开源项目，使每个开发人员更容易地构建微服务应用程序\n\n* [《Waltz: A Distributed Write-Ahead Log》](https://wecode.wepay.com/posts/waltz-a-distributed-write-ahead-log)\n\n介绍: 分布式预写日志\n\n* [《Reading List – Designing a Practical Distributed System》](https://devpoga.org/distributed_system/)\n\n介绍: 设计实用的分布式系统阅读清单\n\n* [《A Generalised Solution to Distributed Consensus》](https://arxiv.org/abs/1902.06776)\n\n介绍: 分布式共识问题一直以来是大规模系统的一个难题，本文讨论了一些分布式共识的通用解决方案。[详细介绍](https://blog.acolyer.org/2019/03/08/a-generalised-solution-to-distributed-consensus/)\n\n* [《Paxos vs Raft: Have we reached consensus on distributed consensus?》](https://arxiv.org/abs/2004.05074)\n\n介绍: 这篇论文对比分布式共识算法Paxos和Raft。讨论了为什么对于诞生的2014年诞生的Raft算法如此受业界亲睐。使用Raft的理论来解释Paxos算法，通过类比的方式发现，两者在大体上是相类似的。不同点在于Leader选举。论文得出的结论是：Raft比Paxos更易用是因为论文解释的比较清楚。\n\n* [《Concurrent and Distributed Systems》](https://www.cl.cam.ac.uk/teaching/2021/ConcDisSys/)\n\n介绍: 卡内基梅隆大学2021年分布式系统课程主页，围绕这个并发和分布式系统讨论。分布式章节的讲师是DDIA书籍的作者Martin Kleppmann，并且相关的视频也已经放到[Youtube](https://www.youtube.com/playlist?list=PLeKd45zvjcDFUEv_ohr_\n\nHdUFe97RItdiB).\n\n* [《Patterns of Distributed Systems》](https://martinfowler.com/articles/patterns-of-distributed-systems/)\n\n介绍: 在线电子书，讲述分布式系统模式。类似编程语言中的设计模式。列出了目前业界常用的分布式系统设计模式。WAL、两步提交、版本向量、复制日志等\n\n* [《Amazon DynamoDB: A Scalable, Predictably Performant, and Fully Managed NoSQL Database Service》](https://assets.amazon.science/33/9d/b77f13fe49a798ece85cf3f9be6d/amazon-dynamodb-a-scalable-predictably-performant-and-fully-managed-nosql-database-service.pdf)\n\n介绍: 亚马逊自2007年发表了一篇DynamoDB论文后，对后面的分布式系统设计产生了深远的影响；论文主要介绍了亚马逊运营大规模 DynamoDB 的经验以及它的架构是如何满足客户工作负载不断增长的需求。这篇论文非常适合做DBaas服务的工程师阅读，让人有一种“知己难寻”的感觉\n\n* [《Distributed Consensus Reading List 📚》](https://github.com/heidihoward/distributed-consensus-reading-list)\n\n介绍: 自20世纪80年代成立以来，分布式共识一直是广泛的学术研究的主题。虽然定义不同，但分布式共识（或等同于原子广播）最常指的是如何在一组分布式节点之间决定一个有序的数值序列的问题。这可以用来实现一个只附加复制的日志，可以直接或间接地利用它来提供服务，如主备份复制或状态机复制。这些抽象可以反过来形成新的抽象的组成部分，如分布式键值存储。一些共识算法反而只决定一个单一的值或一个部分有序的值序列。统一分布式共识算法的是，无论延迟和崩溃，它们总是安全的（尽管它们不一定是拜占庭式的容错），而且只要有足够的活泼性，就能保证取得进展。列表中带⭐️ 的代表有影响力的论文。💎是项目作者认为不错的论文。\n\n"
  },
  {
    "path": "golang.md",
    "content": "## Golang资料集\n\n* [《Platform-native GUI library for Go》](https://github.com/andlabs/ui)\n\n介绍：跨平台的golang GUI库,支持Windows(xp以上),Unix,Mac OS X(Mac OS X 10.7以上)\n\n* [《Gopm 快速入门》](https://github.com/gpmgo/docs/tree/master/zh-CN)\n\n介绍：[Gopm](https://github.com/gpmgo/gopm)(Go 包管理工具) 是一个用于搜索、安装、更新和分享 Go 包的管理工具。\n\n* [《go build 命令是如何工作的？》](http://mikespook.com/2013/11/%E7%BF%BB%E8%AF%91-go-build-%E5%91%BD%E4%BB%A4%E6%98%AF%E5%A6%82%E4%BD%95%E5%B7%A5%E4%BD%9C%E7%9A%84%EF%BC%9F/)\n\n介绍：本文以 Go 的标准库为例，介绍了 Go 编译过程的工作原理。\n\n* [《Go 语言的国际化支持(资源文件翻译)》](http://my.oschina.net/chai2010/blog/190914)\n\n介绍：在之前的 [Go语言的国际化支持(基于gettext-go)](http://my.oschina.net/chai2010/blog/190914)中, 讲到了如何翻译源代码中的字符串.\n\n* [《Go语言资源自动回收技术》](http://my.oschina.net/chai2010/blog/161797)\n\n介绍：Go语言作为一个现代化的编程语言以及支持垃圾内存的自动回收特性(GC). 这篇文章主要介的是非内存资源的自动回收技术.\n\n* [《Go 语言包管理》](http://gopm.io/)\n\n介绍：无需 Git 和 Hg 等版本管理工具，就可以下载指定版本的 Go 语言包\n\n* [《Go 语言中的方法，接口和嵌入类型》](http://se77en.cc/2014/05/05/methods-interfaces-and-embedded-types-in-golang/)\n\n介绍：本文主介绍Go 语言中的方法，接口和嵌入类型。[原文地址](http://www.goinggo.net/2014/05/methods-interfaces-and-embedded-types.html)\n\n* [《golang: 详解interface和nil》](http://my.oschina.net/goal/blog/194233)\n\n介绍：详解golang 的interface和nil.\n\n* [《Go并发编程之Go语言概述》](http://www.infoq.com/cn/articles/go-language-introduction)\n\n介绍：Go并发编程之Go语言概述,主要是一些介绍与语法基础部分\n\n* [《Go 指南》](http://tour.golangtc.com/list)\n\n介绍：里面讲解了变量，函数，方法，接口，并发等相关的知识。而且还有可运行的代码。跨平台\n\n* [《Ubuntu wiki:Golang》](http://wiki.ubuntu.org.cn/Golang)\n\n介绍：Golang的开发环境与一些基础知识的介绍\n\n* [《Golang 国内镜像》](http://docscn.studygolang.com/)\n\n介绍：不用VPN\n\n* [《Go Web 编程》](https://github.com/astaxie/build-web-application-with-golang)\n\n介绍：这是一本开源书籍，本书的作者目前开发了一个开源框架[beego](beego.me)，非常的有名。就目前2014年10月2日截止。在github上面有超过3000多个star了\n\n* [《Building a testable Go web app》](https://sourcegraph.com/blog/building-a-testable-webapp)\n\n介绍：构建一个可测试的go web 应用，step by step \n\n* [《Go名库讲解》](https://github.com/Unknwon/go-rock-libraries-showcases)\n\n介绍：随着 Go 语言的快速发展，各类实用、强大的官方库和第三方库层出不穷。但种类繁多与功能强大的同时，也给不少初学者带来了许多选择和使用上的困扰。很多同学因为时间和精力上的限制，无法很好地体验这些数量庞大的库。因此，作者特别制作本套教程，专门针对当中比较知名和受关注度较高的库进行基于 博客、示例和视频 的三位一体讲解。\n\n* [《Go编程基础》](https://github.com/Unknwon/go-fundamental-programming)\n\n介绍：作者就自身学习go语言的学习经历来讲解，并且讲述了作者在学习中遇到的坑。非常适合零基础的朋友\n\n* [《Go Web基础》](https://github.com/Unknwon/go-web-foundation)\n\n介绍：《Go编程基础》的第二部，本套教程将以搭建个人博客作为实战目标，由浅至深地讲解使用 Go 开发 Web 应用程序的必备知识与技巧。\n\n* [《Go入门指南》](https://github.com/Unknwon/the-way-to-go_ZH_CN)\n\n介绍：《The Way to Go》中文译本.\n\n* [《Building Web Apps with Go》](http://codegangsta.gitbooks.io/building-web-apps-with-go/content/)\n\n介绍：免费电子书,如何构建一个web app\n\n* [《Golang generate 草案 》](http://bms.tratao.com/desktop/doc/e7ef69ebefbf43e35d825a07ee232f17)\n\n介绍：Golang generate 草案,翻译自[Go generate: A Proposal](https://docs.google.com/document/d/1V03LUfjSADDooDMhe-_K59EgpTEm3V8uvQRuNMAEnjg/edit?pli=1)\n\n* [《Go Object Oriented Design 》](http://nathany.com/good/)\n\n介绍：golang的面向对象设计\n\n* [《 Web-based IDE for Teams using Golang. 》](https://github.com/b3log/wide)\n\n介绍：使用golang编写的web ide\n\n* [《 Fluent: HTTP client for Golang. With timeout, retries and exponential back-off 》](https://github.com/lafikl/fluent)\n\n介绍：Fluent HTTP client for Golang. With timeout, retries and exponential back-off support.\n\n* [《 Go 1.4 on Android》](https://www.reddit.com/r/golang/comments/2kv0s1/go_14_on_android/)\n\n介绍：Go 1.4 将支持 Android\n\n* [《Making and Receiving Phone Calls With Golang》](https://www.twilio.com/blog/2014/10/making-and-receiving-phone-calls-with-golang.html)\n\n介绍：使用Golang打电话,接电话\n\n* [《introduce Resources for Go》](http://codecondo.com/golang-resources/)\n\n介绍：国外的Go资源\n\n* [《introduce Resources for Go》](https://github.com/avelino/awesome-go)\n\n介绍：A curated list of awesome Go frameworks, libraries and software \n\n* [《weekly》](https://github.com/zenany/weekly)\n\n介绍：汇总平时看到的好文章，技术、产品、管理均有，尽量保证一周汇总一篇\n\n* [《gorename: easy refactoring tool for Golang》](https://texlution.com/post/gorename/)\n\n介绍：一个简单实用的 Go 语言重构工具\n\n* [《码农周刊分类整理Golang》](https://github.com/nemoTyrant/manong#GO)\n\n介绍：码农周刊分类整理Golang\n\n* [《Go语言诞生5周年！10大Go语言开源项目推荐》](http://code.csdn.net/news/2822941)\n\n介绍：Go语言诞生5周年！10大Go语言开源项目推荐\n\n* [《Interface Upgrades in Go》](http://avtok.com/2014/11/05/interface-upgrades.html)\n\n介绍：Interface的前世今生。\n\n* [《Pool - 一个 Go 语言实现的网络连接池》](https://github.com/fatih/pool)\n\n介绍：一个 Go 语言实现的网络连接池\n\n* [《Patchwork Toolkit》](http://patchwork-toolkit.github.io/)\n\n介绍：一个物联网相关的Go语言框架\n\n* [《Everyday hassles in Go》](http://crufter.com/2014/12/01/everyday-hassles-in-go/)\n\n介绍：作者的一些Go中的困扰，经验之谈\n\n* [《Using Go to improve your Ruby application's performance》](https://antoine.finkelstein.fr/go-in-ruby/)\n\n介绍：使用GO改善Ruby性能\n\n* [《Why is Golang popular in China?》](http://herman.asia/why-is-go-popular-in-china)\n\n介绍：为什么golang在中国如此流行?\n\n* [《Tenus - Golang Powered Linux Networking》](https://cybernetist.com/2014/07/30/tenus-golang-powered-linux-networking/)\n\n介绍：Linux网络驱动\n\n* [《Go 语言入门教程 (Peter Bourgon)》](http://howistart.org/posts/go/1)\n\n介绍：Go 语言入门教程\n\n* [《GXUI》](https://github.com/google/gxui)\n\n介绍：一个 Go 语言跨平台 UI 库  \n\n* [《Go最新资料汇总》](http://studygolang.com/topics/node/13)\n\n介绍：Golang中国社区golang资料汇总\n\n* [《猎豹移动技术博客:Golang》](http://dev.cmcm.com/archives/category/golang)\n\n介绍：猎豹移动技术博客文章\n\n* [《Gohugo》](http://gohugo.io/)\n\n介绍：A fast and modern static website engine.\n\n* [《Our Experience with Golang》](http://www.scriptrock.com/blog/our-experience-with-golang)\n\n介绍：[scriptrock](http://www.scriptrock.com/)公司使用Golang的经验,此外还推荐一个公司的应用[Golang at Runscope](http://blog.runscope.com/posts/go-at-runscope)\n\n* [《Open Sourcing Our Go Libraries》](https://blogs.dropbox.com/tech/2014/07/open-sourcing-our-go-libraries/)\n\n介绍：Dropbox开源Go开发包,[github](https://github.com/dropbox/godropbox).\n\n* [《Tutorial – Building Go Web Apps》](https://www.topcoder.com/blog/building-go-web-apps/)\n\n介绍：如何使用Go构建自己的Web应用教程,此外还推荐[GoLang Tutorials](http://golangtutorials.blogspot.com/2011/05/table-of-contents.html).\n\n* [《Dependency Injection with Go》](http://blog.parse.com/2014/05/13/dependency-injection-with-go/)\n\n介绍：Dependency Injection with Go.\n\n* [《Go Programming Language Resources》](http://go-lang.cat-v.org/)\n\n介绍：Go Programming Language Resources.\n\n* [《Gopher China Website Docs》](https://github.com/gopherchina/docs)\n\n介绍：2015年中国Gopher大会资料.\n\n* [《Structuring Applications in Go》](https://medium.com/@benbjohnson/structuring-applications-in-go-3b04be4ff091)\n\n介绍：新手使用Go构建应用建议.\n\n* [《A curated list of Golang books》](https://github.com/dariubs/GoBooks)\n\n介绍：Golang 图书列表.\n\n* [《Go crypto: bridging the performance gap》](https://blog.cloudflare.com/go-crypto-bridging-the-performance-gap/)\n\n介绍：CloudFlare的Go密码库crypto:弥合性能差距,[项目地址](https://github.com/cloudflare/go).\n\n* [《go-bootstrap》](http://go-bootstrap.io/)\n\n介绍：Generates a lean and mean Go web project.\n\n* [《gonix》](https://github.com/polegone/gonix)\n\n介绍：用Golang实现linux命令.\n\n* [《深入解析Go》](https://github.com/tiancaiamao/go-internals)\n\n介绍：深入解析Go书籍.\n\n* [《50 Shades of Go: Traps, Gotchas, and Common Mistakes for New Golang Devs》](http://devs.cloudimmunity.com/gotchas-and-common-mistakes-in-go-golang/)\n\n介绍：Go编程陷阱.\n\n* [《Gb, a project based Golang build tool》](https://github.com/constabulary/gb)\n\n介绍：a project based Golang build tool.\n\n* [《Fundamentals of concurrent programming》](http://www.nada.kth.se/~snilsson/concurrency/)\n\n介绍：Go并发编程基础,[译版](http://blog.xiayf.cn/2015/05/20/fundamentals-of-concurrent-programming/).\n\n* [《fleet》](https://github.com/coreos/fleet)\n\n介绍：fleet 绑定了systemd 和etcd 到一个分布式init 系统，可以认为是systemd 的扩展，但是并不是机器级别的，而是集群级别的.\n\n* [《Heim-A real-time community platform》](https://github.com/euphoria-io/heim)\n\n介绍：用go开发的实时通讯平台,数据库使用的pgsql.\n\n* [《Golang Performance Tips》](https://joshrendek.com/2015/09/golang-performance-tips/)\n\n介绍：Golang Performance Tips.\n\n* [《go, web, go ---On the web, Go, and building things》](https://elithrar.github.io/)\n\n介绍：推荐一个博客,以go开发为主,文如其名.\n\n* [《GoLang Books》](https://github.com/dariubs/GoBooks)\n\n介绍：GoLang 书籍集合.\n\n* [《50 Shades of Go: Traps, Gotchas, and Common Mistakes for New Golang Devs》](http://devs.cloudimmunity.com/gotchas-and-common-mistakes-in-go-golang/)\n\n介绍：Go开发新手常犯的50个错误.\n\n* [《Golang By Eaxmples》](https://gobyexample.com/)\n\n介绍：Golang基本代码实例,[中文版](http://gobyexample.everyx.in/).\n\n* [《Golang News News for Go programmers》](http://golangnews.com/)\n\n介绍：Golang news.\n\n* [《fasthttp:Fast HTTP package for Go》](https://github.com/valyala/fasthttp)\n\n介绍：Fast HTTP package for Go.\n\n* [《fasthttp:Fast HTTP package for Go》](http://golang-china.github.io/gopl-zh/)\n\n介绍：[《The Go Programming Language》](http://gopl.io/) 的 读书笔记 和 习题解答.\n\n* [《The Go Programming Language》](https://wizardforcel.gitbooks.io/gopl-zh/content/)\n\n介绍：Go 语言圣经中文版\n\n* [《Network Programming with Go》](https://jannewmarch.gitbooks.io/network-programming-with-go-golang-/content/)\n\n介绍：这是一本关于使用golang写网络程序的电子书.\n\n* [《Seesaw:Google Open Source Load Balancer (Written in Go》](https://github.com/google/seesaw)\n\n介绍：谷歌开源的一款负载均衡器,[官方介绍](http://google-opensource.blogspot.com/2016/01/seesaw-scalable-and-robust-load.html).注意：非官方项目\n\n* [《Effective Go》](https://golang.org/doc/effective_go.html#introduction)\n\n介绍：Effective Go几乎是学习Go语言所必须阅读的重要的文档,涉及内容丰富，很多精要部分。中文参考[译文参考1](http://www.hellogcc.org/effective_go.html)，[译文参考2](http://www.chingli.com/coding/effective-go/)\n\n* [《Golang go》](http://golanggo.com/)\n\n介绍：Go语言日报,每天新鲜事\n\n* [《The Little Go Book》](http://openmymind.net/The-Little-Go-Book/)\n\n介绍：Golang小书,作者[主页](http://openmymind.net)的go资料也不错\n\n* [《Go 语言GUI库GoQt》](https://github.com/visualfc/goqt)\n\n介绍：在Go中使用Qt构建跨平台应用.\n\n* [《HTTP Request Contexts & Go》](http://elithrar.github.io/article/map-string-interface/)\n\n介绍：这篇文章是 Golang 开源库 Negroni 的[README.md](https://github.com/codegangsta/negroni)中推荐一篇的文章，讲的是 Golang 中如何处理请求的上下文信息.[译文](http://www.jianshu.com/p/177249bb0842)\n\n* [《服务端开发那些事儿》](http://www.csdn.net/article/2015-11-06/2826139)\n\n介绍：国内七牛云存储应用实践.\n\n* [《Good practices for writing shell scripts》](http://www.yoone.eu/articles/2-good-practices-for-writing-shell-scripts.html)\n\n介绍：Shell脚本编写良好实践指南.\n\n* [《Golang Wiki》](https://github.com/golang/go/wiki)\n\n介绍：Golang官方开源项目wiki主页,内容丰富.是学习golang的重要参考，文中还推荐了[awesome golang](http://awesome-go.com/).\n\n* [《Golang Courses》](https://github.com/golang/go/wiki/Courses)\n\n介绍：国外很多大学把Golang作为学习课程,本页推荐了很多相关的课程,新手可以学习参考.\n\n* [《Go实战开发》](https://github.com/astaxie/Go-in-Action)\n\n介绍：作者写这本书主要是灵感来自于： https://github.com/thekarangoel/Projects ，然后作者就想到了当初做PHP的时候，也有类似的项目，觉得golang也可以实现一个类似的书籍，暂且把书名定为《Go实战开发》.\n\n* [《Golang 语言基础之一： type, variable, constant》](http://xhrwang.me/2014/12/22/golang-fundamentals-1-types-variables-constants.html)\n\n介绍：Golang 语言学习基础教程.\n\n* [《Go Examples》](https://github.com/ibmendoza/go-examples)\n\n介绍：Collection of Go programs for quick reference,golang新手入门看源码就可以了.\n\n* [《Notes on Go》](https://brandur.org/go)\n\n介绍：国外的一位开发者在实践开发一个大型项目之后所写的笔记\n\n* [《Learning Go: Lexing and Parsing》](http://blog.leahhanson.us/post/recursecenter2016/recipeparser.html)\n\n介绍：利用go进行词法分析\n\n* [《dotConferences talks》](https://www.dotconferences.com/conference/dotgo-2017)\n\n介绍：dotGo conference 是相当盛大的 Golang 研讨会， Google 与 Golang 社群有许多权威都有加入這场盛会． 在這場有有许多值得一听的演讲． Francesc 讲 Machine Learning in Go Sam Boyer (dep 的主要开发者之一) 來讲 Dep Sameer Ajmani (Go team manager ) 來讲 Simulation real world in Go\n\n* [《A Gopher's Reading List》](https://github.com/enocom/gopher-reading-list)\n\n介绍：Golang学习阅读列表，基础知识、经典文章（高效的golang、并发）、编码风格、测试、Web、性能分析、垃圾回收、性能处理、字符编码处理、JSON编码与解码\n\n* [《Go libraries》](https://golanglibs.com/)\n\n介绍：Golang库搜索\n\n* [《Golang libraries of uber》](https://go.uber.org/)\n\n介绍：Uber的开源核心库。从重可以学习到一个大型系统的Go语言结构设计，里面涉及到配置、日志、工具组件、RPC、监控\n\n* [《Go语言高级编程(Advanced Go Programming)》](https://chai2010.gitbooks.io/advanced-go-programming-book/)\n\n介绍：本书涵盖CGO、Go汇编语言、RPC实现、Web框架实现、分布式系统等高阶主题，针对Go语言有一定经验想深入了解Go语言各种高级用法的开发人员。对于刚学习Go语言的读者，建议先从[《Go语言圣经》](https://github.com/gopl-zh/gopl-zh.github.com)开始系统学习Go语言的基础知识。\n\n* [《GopherCon 2018 liveblog》](https://about.sourcegraph.com/go/)\n\n介绍：GopherCon 2018会议分享文本,主题：包的实现，Go contributor，代码优化、机器学习的应用、项目结构、图像识别、测试\n\n* [《Go security》](https://github.com/guardrailsio/awesome-golang-security)\n\n介绍：Golang在安全领域的应用\n\n* [《Go conference》](https://github.com/golang/go/wiki/Conferences)\n\n介绍：Go会议主页列表。\n\n* [《Go 101》](https://go101.org/article/101.html)\n\n介绍：Go 101是一个系列，包含语言基础、技巧、内部细节、常见疑问。有[中文版](https://gfw.go101.org/article/101.html)\n\n* [《Understanding Real-World Concurrency Bugs in Go》](https://engineering.purdue.edu/~yiying/GoStudy-ASPLOS19.pdf)\n\n介绍：总结了非常多数量且有用的真实 Bug，用以警示我们未来使用这些同步原语时可能会犯的错误。[讨论](https://github.com/developer-learning/reading-go/issues/464)\n\n* [《Uber Go Style Guide》](https://github.com/uber-go/guide)\n\n介绍：Uber Go语言编码规范,[中文参考](https://tonybai.com/2019/10/12/uber-go-style-guide/)\n\n* [《Go语言四十二章经》](https://github.com/ffhelicopter/Go42)\n\n介绍：详细讲述Go语言规范与语法细节及开发中常见的误区，通过研读标准库等经典代码设计模式，启发读者深刻理解Go语言的核心思维，进入Go语言开发的更高阶段。\n\n* [《go.dev》](https://go.dev/)\n\n介绍：Go官方团队又一生态建设社区，它提供了 godoc.org 的文档，界面更加友好。\n"
  },
  {
    "path": "node.md",
    "content": "模块Github地址：https://github.com/felixge/node-mysql\n\n微博:[@廖君Jun](http://weibo.com/ty4z2008)\n\n自己还是一个学生，第一次翻译。不恰当的地方还希望不吝批评。联系方式可以直接微博AT我\n\n## 安装\n\n```bash\nnpm install mysql\n```\n\n如果需要以前的版本0.9.x系列的文档，请访问[v0.9 branch]: https://github.com/felixge/node-mysql/tree/v0.9.\n\n有时你可以从github中安装最新版本的node-mysql，具体怎么做请参考下面的示例：\n\n```bash\nnpm install felixge/node-mysql\n```\n\n## 介绍\n这是一个node.Js的mysql驱动程序。这个驱动完全是用javascript写的，不需要任何编译工作。完全的遵守MIT开源协议。\n\n这里有一个简单的示例告诉你如何使用它:\n\n```js\nvar mysql      = require('mysql');\nvar connection = mysql.createConnection({\n  host     : 'localhost',\n  user     : 'me',\n  password : 'secret',\n  database : 'my_db'\n});\nconnection.connect();//建立连接\nconnection.query('SELECT 1 + 1 AS solution', function(err, rows, fields) {\n  if (err) throw err;\n  console.log('The solution is: ', rows[0].solution);\n});\nconnection.end();//释放连接\n```\n\n从上面这个例子中，你应该要知道如下的两点：\n\n每个方法调用在连接队列中是按顺序执行。\n\n当使用`end()`函数关闭连接时候，你必须要确保你的所有查询都已经发送给了mysql服务器。否者`end()`之后的查询是无效的。\n\n## 贡献者\n\n非常感谢那些给这个模块开发作贡献的朋友[GitHub Contributors page][].\n\n\n[GitHub Contributors page]: https://github.com/felixge/node-mysql/graphs/contributors\n\n其中，我特别需要感谢的两位：\n\n[Andrey Hristov][]  (Oracle) 与[Ulf Wendel][]帮我解决了一些数据库协议上面的问题\n\n[Ulf Wendel]: http://blog.ulf-wendel.de/\n\n[Andrey Hristov]: http://andrey.hristov.com/\n\n## 赞助商\n\n特别的感谢下面这些公司在资金上面的赞助，让我能够有更多的时间在这个项目上面(下面的名次根据赞助时间排序)\n\n* [Transloadit](http://transloadit.com) (我的首位赞助公司，他们公司主要是提供文件上传与视频转码服务，瞧瞧吧)\n* [Joyent](http://www.joyent.com/)\n* [pinkbike.com](http://pinkbike.com/)\n* [Holiday Extras](http://www.holidayextras.co.uk/)  (他们正在招聘[hiring](http://join.holidayextras.co.uk/vacancy/software-engineer/))\n* [Newscope](http://newscope.com/)  (他们正在招聘[hiring](http://www.newscope.com/stellenangebote))\n\n\n如果你也对这个项目感兴趣，那么你也可以赞助我们，请点击[get in touch][].\n\n[get in touch]: http://felixge.de/#consulting\n\n##社区支持\n\n如果你也想参与到这个模版讨论，或者是有问题需要询问，可以通过下面的方式来联系：\n\n* **Google论坛**：https://groups.google.com/forum/#!forum/node-mysql\n* **IRC频道**： #node.js (freenode.net,只要包含有mysql的所有问题我都会关注的)\n\n## 创建连接\n\n推荐的一种连接方式：\n```js\nvar mysql      = require('mysql');\nvar connection = mysql.createConnection({\n  host     : 'example.org',\n  user     : 'bob',\n  password : 'secret'\n});\n\nconnection.connect(function(err) {\n  if (err) {\n    console.error('error connecting: ' + err.stack);\n    return;\n  }\n\n  console.log('connected as id ' + connection.threadId);\n});\n```\n然而，一个连接只能隐式的调用一个`query`函数。调用方式如下：\n```js\nvar mysql      = require('mysql');\nvar connection = mysql.createConnection(...);\n\nconnection.query('SELECT 1', function(err, rows) {\n  //成功连接! (unless `err` is set)\n});\n```\n\n上面的两种错误处理方法都合适，这取决于你更喜欢那一种方式来做数据库错误信息处理。任何一种连接上的错误（握手与网络）都会被视为致命错误，具体更多的错误处理信息可以查看[Error Handling](#error-handling)章节。\n\n## 连接可选参数\n当我们使用Node-MySQL建立一个数据库连接的时候你可以通过下面这些选项：\n* `host`:数据库的主机名（默认： `localhost`）\n\n* `port`:数据库服务器的端口（默认： `3306`）\n\n* `localAddress`:使用TCP连接的源IP地址（可选）\n\n* `socketPath`:使用Unix域套接字连接的路径，当使用 `host` 与`port` 的时候可以忽略。\n\n* `user`:这个是MySQL身份验证的用户名。\n\n* `password`:MySQL用户的密码。\n\n* `database`:连接的数据库名(可选).\n\n* `charset`:连接之后的字符编码(默认:`UTF8_GENERAL_CI`,值得提醒的是，这个值必须都是大写字母).\n\n* `timezone`:这个是储存数据的是当前时间。(默认:` local`).\n\n* `connectTimeout`:MySQL初始连接的超时时间。单位是毫秒(默认:无超时限制)。\n\n* `stringifyObjects`:把值转换为Stringify对象。具体见问题 [#501](https://github.com/felixge/node-mysql/issues/501)。(默认：`false`)。\n\n* `insecureAuth`:允许使用老（不安全）的身份认证方式去连接MySQL数据库.(默认：` false`).\n\n* `typeCast`:是否把结果值转换为原生的javascript类型(默认: `true`).\n\n* `queryFormat`:一个可以自己定义查询格式函数(具体见[Custom format](#custom-format))。\n\n* `supportBigNumbers`: 当在数据库中处理一个大数(`BIGINT`和`DECIMAL`)数据类型的时候，你需要启用这个选项(默认: `false`).\n\n* `bigNumberStrings`:这个选项需要`bigNumberStrings`与 `supportBigNumbers`同时启用，强制把数据库中大数(BIGINT和DECIMAL)数据类型的值转换为javascript字符对象串对象返回。(默认:`false`)。当启用`supportBigNumbers`选项，但 `bigNumberStrings`是未启用的状态。当无法用javascript数字对象([JavaScript Number objects](http://ecma262-5.com/ELS5_HTML.htm#Section_8.5))所表达的时候就会返回的是一个big number字符串对象(值的范围要在 [-2^53, +2^53]之间).否则将会返回一个Number类型的对象。如果`supportBigNumbers`是`false`那么这个选项会被自动忽略。\n\n* `dateStrings`:强制为date类型(`TIMESTAMP`，`DATETIME`，`DATE`)转化为一个字符串返回而不是转换成javascript的date类型对象。(默认: `false`)\n\n* `debug`:答应协议详细信息到标准输出(默认: `false`).\n\n* `trace`:产生栈跟踪当在库的入口点出现`error`时,当调用数次很多时性能会略微下降(默认: `true`).\n\n* `multipleStatements`:允许每个mysql语句有多条查询.使用它时要非常注意，因为它很容易引起sql注入攻击(默认:`false`).\n\n* `flags`:使用连接标示符号标示出超过默认的值的连接。它也可以加到默认的黑名单连接中。更多信息参考（[Connection Flags](#connection-flags)）。 \n\n* `ssl`:使用`ssl`参数对象()或者是用一个包含ssl配置的字符串名。[SSL options](#ssl-options)\n\n  除了把这些选项写成对象的样式以外，你也可以用一个字符串来表示。例如：\n\n```js\nvar connection = mysql.createConnection('mysql://user:pass@host/db?debug=true&charset=BIG5_CHINESE_CI&timezone=-0700');\n```\n\n注意：查询出来的值第一会尝试转换为json格式,如果转换失败.那么就会转换成纯文本的字符串.\n###SSL\n``ssl``参数在连接的选项里面可以是字符串或对象，当是一个字符串的时候它会使用已经存在的ssl证书。例如：\n* `\"Amazon RDS\"`:目前仅仅支持亚马逊的ca证书，参考：https://rds.amazonaws.com/doc/rds-ssl-ca-cert.pem \n  当连接到其他服务器的时候，你需要提供一个参数对象。格式可以参考[crypto.createCredentials](http://nodejs.org/api/crypto.html#crypto_crypto_createcredentials_details).请注意参数请求的证书是整个证书名(包括文件后缀),而不只是单单的文件名这里有一个简单的例子:\n```js\nvar connection = mysql.createConnection({\n  host : 'localhost',\n  ssl  : {\n    ca : fs.readFileSync(__dirname + '/mysql-ca.crt')\n  }\n});\n```\n你也可以不使用证书来建立数据库连接,但是你得把`rejectUnauthorized`设置为false\n```js\nvar connection = mysql.createConnection({\n  host : 'localhost',\n  ssl  : {\n    // DO NOT DO THIS\n    // 设置正确的连接方式\n    rejectUnauthorized: false\n  }\n});\n```\n##关闭连接\n有两种关闭连接的方式，当查询完成后最优雅关闭连接方式是调用end()方法,例如：\n\n```js\nconnection.end(function(err) {\n  // 连接在这里会被终止\n});\n```\n这样可以确保在查询队列完成之后发送一个`COM_QUIT` 包到mysql服务器。如果在发送`COM_QUIT`出现致命的错误。在回调函数里面有一个`err`参数可以使用。但是这个连接无论如何也会被关闭掉。\n\n另外一种替代`end()`方法的是调用`destroy()`方法，这个方法会立即终止底层socket连接.`destroy()`方法确保了没有任何事件或回调再连接触发。\n\n```js\nconnection.destroy();\n```\n\n`destroy()`方法不像`end()`方法， `destroy()`方法是没有任何回调参数的。\n\n##连接池\n直接使用连接池\n\n```js\nvar mysql = require('mysql');\nvar pool  = mysql.createPool({\n  host     : 'example.org',\n  user     : 'bob',\n  password : 'secret'\n});\n\npool.query('SELECT 1 + 1 AS solution', function(err, rows, fields) {\n  if (err) throw err;\n\n  console.log('The solution is: ', rows[0].solution);\n});\n\n```\n\n连接可以轻易的共享一个连接或者是管理多个连接：\n\n```js\nvar mysql = require('mysql');\nvar pool  = mysql.createPool({\n  host     : 'example.org',\n  user     : 'bob',\n  password : 'secret'\n});\npool.getConnection(function(err, connection) {\n  //连接成功!(除非有`err`)\n});\n```\n\n\n如果你想在连接前设置session变量并且获取使用。你可以监听`connection`事件：\n\n```js\npool.on('connection', function(connection) {\n  connection.query('SET SESSION auto_increment_increment=1')\n});\n```\n当你的连接完成后，只需要调用`connection.release()`方法。将连接返回到池中，以供其他人再次使用。\n```js\nvar mysql = require('mysql');\nvar pool  = mysql.createPool(...);\n\npool.getConnection(function(err, connection) {\n  //使用连接\n  connection.query( 'SELECT something FROM sometable', function(err, rows) {\n     //连接使用完成后释放连接\n    connection.release();\n\n    //不要在这里使用connection进行查询，因为连接已经被归还到连接池了\n  });\n});\n```\n\n如果你想关闭连接并且从连接池中移除，使用`connection.destory()`方法代替。当你下一次需要使用的时候，池会自动创建一个新的连接。\n通过池创建连接是非常缓慢的。如果你配置你的连接池最大的连接数为100，当你只需要同时使用5个连接时候，它也仅仅只会创建5个连接。这种连接的循环方式是一种轮询(round-robin)的方式。采取的是从连接池顶部到底部的方式。\n\n## Pool参数选项\n池连可以接受一些连接的参数选项。当一个连接创建之后，这些参数选项通过简单的构造传递到连接里面。池连接参数可以接受下面这些参数。\n* `waitForConnections`:判断当前的连接是否可用并且是否已经达到了连接数的上限。如果是`true`。这个连接就会加入到连接队列中同时把状态转换为可用状态。如果是`false`，那么会立即返回一个错误给开发者。(默认：`true`).\n* `connectionLimit`:一次连接最大的连接数(默认:`10`)。\n* `queueLimit`:从`getConnection`获取连接数并且判断是否超出了`queneLimit`限制的排队等待的连接值，如果是就返回一个错误。如果设置为`0`，就是不限制连队列数(默认：`0`)。\n\n## PoolCluster\nPoolCluster提供了多台主机连接功能(group&retry&selector)：\n\n```js\n//创建连接\nvar poolCluster = mysql.createPoolCluster();\n\npoolCluster.add(config); // anonymous group\npoolCluster.add('MASTER', masterConfig);\npoolCluster.add('SLAVE1', slave1Config);\npoolCluster.add('SLAVE2', slave2Config);\n\n// 目标主机组 : ALL(anonymous, MASTER, SLAVE1-2), 连接方式 : round-robin(default)\npoolCluster.getConnection(function (err, connection) {});\n\n// 目标主机组 : MASTER, 连接方式: round-robin\npoolCluster.getConnection('MASTER', function (err, connection) {});\n\n// 目标主机组 : SLAVE1-2, 连接方式 : order\n// 如果不能连接到SLAVE1就连接SLAVE2（把SLAVE1从集群节点中删除）\npoolCluster.on('remove', function (nodeId) {\n  console.log('REMOVED NODE : ' + nodeId); // nodeId = SLAVE1 \n});\n\npoolCluster.getConnection('SLAVE*', 'ORDER', function (err, connection) {});\n\n// 命名方式: of(pattern, selector)\npoolCluster.of('*').getConnection(function (err, connection) {});\n\nvar pool = poolCluster.of('SLAVE*', 'RANDOM');\npool.getConnection(function (err, connection) {});\npool.getConnection(function (err, connection) {});\n\n// 释放连接\npoolCluster.end();\n```\n\n\n##PoolCluster选项\n* `canRetry`:如果是`true`,当连接失败时`Poolcluster`会尝试重新连接(默认:`true`)。\n* `removeNodeErrorCount`:如果连接失败,节点的`errorCount`将会增加.当`errorCount`大于`removeNodeErrorCount`时，会从`poolCluster`中移除一个节点。(默认:`5`).\n* `defaultSelector`:默认选择器(默认:`RR`).\n* `RR`:选择一个交替(轮循)\n* `RANDOM`：由随机函数选择一个节点.\n* `ORDER`:按照顺序无条件的选择第一个节点。\n\n```js\nvar clusterConfig = {\n  removeNodeErrorCount: 1, // 连接失败后立即从把该节点移除\n  defaultSelector: 'ORDER'\n};\n\nvar poolCluster = mysql.createPoolCluster(clusterConfig);\n```\n\n##切换用户/修改连接状态\nMySQL提供了ChangeUser的命令，允许你更改当前用户并且切换用户时不需要关闭底层socket连接:\n```js\nconnection.changeUser({user : 'john'}, function(err) {\n  if (err) throw err;\n});\n```\n这个功能提供了几个有用的参数选项： \n* `user`:新用户的名字。（默认为切换新用户前第一个用户）\n* `password`:新用户的密码（默认为切换新用户前第一个用户）\n* `charset`:新的字符编码（默认为切换新用户前第一个用户）\n* `database`:新的数据库名（默认为切换新用户前第一个用户）\n\n这个功能有时有一个副作用，它会把所有的连接状态都重置（变量，事务）.\n注意：此操作出现的错误会被该模块视为致命错误处理。\n\n##服务器连接断开\n由于网络问题你有可能丢失与MySQL服务器的连接。也有可能被服务器踢出连接，还有可能是服务器重启或是崩溃等等，这些都是致命的错误都被归为`error`对象里面。并且模块提供了`err.code = 'PROTOCOL_CONNECTION_LOST'`信息，更多的错误处理信息请参考[Error Handling](#error-handling) 。\n与服务器重连是建立一个新的连接，一旦现在的连接断开就不能让这个连接重新连接。它必须重新建立一条连接，连接到数据库服务器。\n在连接池里面，当连接断开时会从连接池里面把连接移除，当下次需要连接的时候调用`getConnection`创建一个新的连接。\n\n转义查询值\n为了避免被SQL注入攻击,你需要把用户提交过来的数据进行转义之后再放到SQL查询语句里面。模块提供了`connection.escape()`和`Pool.escape()`两种方法：\n\n```js\nvar userId = 'some user provided value';\nvar sql    = 'SELECT * FROM users WHERE id = ' + connection.escape(userId);\nconnection.query(sql, function(err, results) {\n  // ...\n});\n```\n或者，你可以使用占位符`?`来代替，同样的也能对传入的值进行转义:\n\n```js\nconnection.query('SELECT * FROM users WHERE id = ?', [userId], function(err, results) {\n  // ...\n});\n```\n这看起来像是使用了MySQL的预处理语句，其实同样的在MySQL内部也是使用了类似`connection.escape()`的方法。\n**注意**这不同于MySQL预处理语句，因为它会把所有的`?`都替换掉.\n不同的是类型转义的值不同。请看下面的解释:\n* Number类型保存不变.\n* Boolean值被转换为了`true/false`字符串.\n* Date类型被转换为了`YYYY-mm-dd HH:ii:ss`字符串\n* Buffer转换为了16进制，例如:`X'0fa5'`\n* String转换为了安全的字符串。\n* Array转换为了`list`。例如:`['a','b']`会返回`'a','b'`\n  多维数组会被转换为多维`list`。例如`[['a', 'b'], ['c', 'd']]`返回`('a', 'b'), ('c', 'd')`\n* Object转换为`key = 'val'`;多维Object对象会转换为字符串.\n* undefined/null会转换为`null`\n* NaN / Infinity 保持不变,因为MySQL现在并不支持这些对象，如果你把`NaN/Infinity`做为值,MySQL会报错.直到它们被MySQL支持。\n\n如果你留意了，你会发现转义查询值可以巧妙的用下面这种方式:\n\n```js\nvar post  = {id: 1, title: 'Hello MySQL'};\nvar query = connection.query('INSERT INTO posts SET ?', post, function(err, result) {\n  // Neat!\n});\nconsole.log(query.sql); // INSERT INTO posts SET `id` = 1, `title` = 'Hello MySQL'\n\n```\n\n如果你觉得有必要自己去转义查询值，那么你可以直接去调用转义函数：\n\n```js\nvar query = \"SELECT * FROM posts WHERE title=\" + mysql.escape(\"Hello MySQL\");\n\nconsole.log(query); //SELECT * FROM posts WHERE title='Hello MySQL'\n```\n\n##转义查询标示符\n如果你不信任用户提交过来的标示符(database/table/column name)。那么你需要使用mysql.escapeId(identifier)来转义:\n```js\nvar sorter = 'date';\nvar query = 'SELECT * FROM posts ORDER BY ' + mysql.escapeId(sorter);\n\nconsole.log(query); // SELECT * FROM posts ORDER BY `date`\n```\n它还支持添加合格的转义符。不过得把转义的分成两部分:\n\n```js\nvar sorter = 'date';\nvar query = 'SELECT * FROM posts ORDER BY ' + mysql.escapeId('posts.' + sorter);\n\nconsole.log(query); // SELECT * FROM posts ORDER BY `posts`.`date`\n```\n\n或者,你可以使用占位符`??`，它会自动转义查询的值：\n\n```js\nvar userId = 1;\nvar columns = ['username', 'email'];\nvar query = connection.query('SELECT ?? FROM ?? WHERE id = ?', [columns, 'users', userId], function(err, results) {\n  // ...\n});\n\nconsole.log(query.sql); // SELECT `username`, `email` FROM `users` WHERE id = 1\n```\n\n**请注意：最后的一个字符转义目前还在实验阶段，而且语法随时可能发生改变。**\n当你使用`.escape()`,`.query()`,`.escapeId()`时可以有效的防御SQL注入攻击.\n###预查询\n你可以使用`mysql.format()`去执行预处理多嵌套查询语句，利用适当的转义处理对于标示符与值.下面有一个简单的例子:\n\n```js\nvar sql = \"SELECT * FROM ?? WHERE ?? = ?\";\nvar inserts = ['users', 'id', userId];\nsql = mysql.format(sql, inserts);\n```\n这种方法可以确保发送到数据库进行数据查询之前就能够保证查询语句的安全,在发送到数据库查询之前执行预查询，这个功能非常的有用。由于`mysql.format`是由sql的`String.format`暴露出来的。所以你可以你还可以选择传递`stringifyObject` 和`timezone`对象(不强制要求)。并且允许您自定义把对象转换字符串的方法。以及特定地区的时间和时区(`location  specific/timezone aware Date`).\n###自定义格式\n如果您喜欢其他样式的转义格式。你可以在连接配置选项中自定义你的功能函数。如果你还想使用`escape()`或其他内置的函数。可以直接调用\n这儿我们提供了一个示例：\n```js\nconnection.config.queryFormat = function (query, values) {\n  if (!values) return query;\n  return query.replace(/\\:(\\w+)/g, function (txt, key) {\n    if (values.hasOwnProperty(key)) {\n      return this.escape(values[key]);\n    }\n    return txt;\n  }.bind(this));\n};\n\nconnection.query(\"UPDATE posts SET title = :title\", { title: \"Hello MySQL\" });\n```\n##获取插入值之后的ID\n如果你想获取插入一行值之后，获取自动递增主键的ID。你可以这样获取:\n```js\nconnection.query('INSERT INTO posts SET ?', {title: 'test'}, function(err, result) {\n  if (err) throw err;\n\n  console.log(result.insertId);\n});\n\n```\n当处理大数字的时候(超过javascript Number类型的精度),你需要启用`supportBigNumbers`以便把ID作为字符串类型读取。否者会抛出错误.\n而且当从数据库中查询的数字是一个`big number`类型的时候，你也需要把`supportBigNumbers`选项设置为`true`，否则查询出来的数据在传输过来的时候由于精度限制，自动删除超出部分。\n##获取影响的行数\n你可以在执行delete，insert，update之后获取影响的行数\n```js\nconnection.query('DELETE FROM posts WHERE title = \"wrong\"', function (err, result) {\n  if (err) throw err;\n\n  console.log('deleted ' + result.affectedRows + ' rows');\n})\n```\n##获取改变的行数\n你可以获取执行update之后改变的行数.\"changedRows\" 与\"affectedRows\"不同在于,changeRows是获取update之后影响的行数. \n```js\nconnection.query('UPDATE posts SET ...', function (err, response) {\n  if (err) throw err;\n\n  console.log('changed ' + result.changedRows + ' rows');\n})\n```\n##获取连接ID\n你可以使用`threadId`方法来获取连接MySQL的ID(线程ID)\n```js\nconnection.connect(function(err) {\n  if (err) throw err;\n  console.log('connected as id ' + connection.threadId);\n});\n```\n##执行并行查询\nMySQL的协议是顺序执行的。所以这就意味这你需要建立多个连接去实现并行查询,你应该需要一个池(Pool)来管理连接。一个简单的方法就是每一个连接都创建的一个HTTP请求连接.\n##数据流查询\n有时，你可能去执行一个大的查询，并且要处理查询返回的每一行结果。那么你可以尝试这样做：\n```js\nvar query = connection.query('SELECT * FROM posts');\nquery\n  .on('error', function(err) {\n    // 处理错误，当出现错误时,会立即发出一个end事件\n  })\n  .on('fields', function(fields) {\n    // the field packets for the rows to follow\n  })\n  .on('result', function(row) {\n   // 处理工程中涉及到I/O可以在这里先暂停连接\n    connection.pause();\n\n    processRow(row, function() {\n      connection.resume();\n    });\n  })\n  .on('end', function() {\n    // 获取所有查询内容\n  });\n```\n\n在上面的例子中请注意几件事情:\n\n*同常的时候你希望当接收到一定数量的查询结果的时候再执行`pause()`方法,这数量取决于你查询总的数量和数据的大小。\n*`pause()`/`resume()`操作底层socket和解析器时，可以确定在调用`pause()`方法之后再有`result`事件被执行\n*当有多条数据流读取时，不能再给query()方法添加一个回调函数.\n在'result'事件中不仅可以返回查询的数据也可以确认query/INSERT执行是否成功.\n*除此之外，你应该有兴趣知道当前的模块并不支持单独一行的流读取。它们都是被缓存起来当SQL执行完之后一并把结果返回过来。假如你有在大型的案例中应用到了MySQL的流技术。我很想能够与您分享。\n\n###管道结果（Piping results）和[Streams2](http://blog.nodejs.org/2012/12/20/streams2/)\n`query`对象提供了一个非常方便的方法`.stream`(可选).它把查询事件封装成了可读(Readable)的Streams2对象,此流可以很容易地通过管道`downstream`，并提供自动化暂停/恢复，基于`downstream`堵塞和可选`highWaterMark`。该流的`objectMode`参数默认设为`true` 。\n例如，把查询结果通过piping导入到另一个流中(最大缓存为5)的简单例子：\n```js\nconnection.query('SELECT * FROM posts')\n  .stream({highWaterMark: 5})\n  .pipe(...);\n```\n###多语句查询\n出于安全考虑，多语句查询默认是禁用的.(如果值没有经过转义，那么很有可能会导致SQL注入攻击)。如果你想使用此功能，你必须在连接中启用它：\n```js\nvar connection = mysql.createConnection({multipleStatements: true});\n```\n一旦启用，你就可以执行多条语句查询了。例如：\n```js\nconnection.query('SELECT 1; SELECT 2', function(err, results) {\n  if (err) throw err;\n\n  // `results` is an array with one element for every statement in the query:\n  console.log(results[0]); // [{1: 1}]\n  console.log(results[1]); // [{2: 2}]\n});\n```\n此外，您也可以串行理的多个语句查询的结果：\n\n```js\nvar query = connection.query('SELECT 1; SELECT 2');\n\nquery\n  .on('fields', function(fields, index) {\n    // the fields for the result rows that follow\n  })\n  .on('result', function(row, index) {\n    // index refers to the statement this result belongs to (starts at 0)\n  });\n```\n如果你有一个查询语句出现了错误，那么抛出的错误会包含在`err.index`属性里面并且会告诉你是哪条语句出现了错误。同时当发生错误时对于剩余的查询语句MySQL也会停止执行.\n注意：目前利用流来执行多条查询语句的接口还在试验阶段。所以我很期待能够得到您的反馈。\n##储存过程\n你可以在你的查询语句里面调用MySQL驱动中自带的任何存储过程，如果你使用存储过程生成的多个结果集，其实也就与您使用多语句查询生成得出的结果是一样的。\n##合并重叠的字段\n当我们使用JOIN函数执行查询的时候得到的结果里面有很多字段是重复的。默认情况下Node-MySQL会按照列读取顺序把一些冲突的列名进行合并。但是这样有可能会导致一些接收到的值变得不可用。\n不过，您可以指定在表名中嵌套您需要的列，就像这样： \n```js\nvar options = {sql: '...', nestTables: true};\nconnection.query(options, function(err, results) {\n  /* results will be an array like this now:\n  [{\n    table1: {\n      fieldA: '...',\n      fieldB: '...',\n    },\n    table2: {\n      fieldA: '...',\n      fieldB: '...',\n    },\n  }, ...]\n  */\n});\n```\n或者你可以使用字符串分隔符合并成你想要的结果:\n\n```js\nvar options = {sql: '...', nestTables: '_'};\nconnection.query(options, function(err, results) {\n  /* results will be an array like this now:\n  [{\n    table1_fieldA: '...',\n    table1_fieldB: '...',\n    table2_fieldA: '...',\n    table2_fieldB: '...',\n  }, ...]\n  */\n});\n```\n##事务处理\n在连接层中可以支持简单的事务处理：\n```js\nconnection.beginTransaction(function(err) {\n  if (err) { throw err; }\n  connection.query('INSERT INTO posts SET title=?', title, function(err, result) {\n    if (err) { \n      connection.rollback(function() {\n        throw err;\n      });\n    }\n\n\tvar log = 'Post ' + result.insertId + ' added';\n\n\tconnection.query('INSERT INTO log SET data=?', log, function(err, result) {\n\t  if (err) { \n        connection.rollback(function() {\n          throw err;\n        });\n      }  \n\t  connection.commit(function(err) {\n\t    if (err) { \n          connection.rollback(function() {\n            throw err;\n          });\n        }\n\t    console.log('success!');\n\t  });\n    });\n  });\n});\n```\n请注意，执行START TRANSACTION, COMMIT,和 ROLLBACK 这些简单命令的方法分别是transaction(),Commit()和rollback(),了解MySQL中一些会造成隐式提交语句很重要。具体的可以看看MySQL的官方文档[in the MySQL documentation](http://dev.mysql.com/doc/refman/5.5/en/implicit-commit.html)\n##错误处理\n这个模块包含了错误处理机制，不过在编码的时候你还应该去自己检查自己的代码。看看是否会有一些意想不到的错误。\n这个模块中所有的错误都是javascript  [Error][]的对象实例，同时它还有两个属性:\n* `err.code`: 任一的MySQL错误 [MySQL server error][] (例如. `'ER_ACCESS_DENIED_ERROR'`), Node.js错误 (例如.`'ECONNREFUSED'`) 或者是内部错误 (e.g. '`PROTOCOL_CONNECTION_LOST'`).\n* `err.fatal`:布尔值,这个对象表示是否能够连接到服务器.\n[Error]: https://developer.mozilla.org/en/JavaScript/Reference/Global_Objects/Error\n[MySQL server error]: http://dev.mysql.com/doc/refman/5.5/en/error-messages-server.html\n致命的错误都可以在回调函数中捕获到。在下面这个例子中,所引起的错误是因为改连接试图连接到一个无效的端口上面。因此错误对象会被传递到回调函数中并且能够使用`err.code`或`err.fatal`知道错误的具体情况:\n\n```js\nvar connection = require('mysql').createConnection({\n  port: 84943, // WRONG PORT\n});\n\nconnection.connect(function(err) {\n  console.log(err.code); // 'ECONNREFUSED'\n  console.log(err.fatal); // true\n});\n\nconnection.query('SELECT 1', function(err) {\n  console.log(err.code); // 'ECONNREFUSED'\n  console.log(err.fatal); // true\n});\n```\n一般情况下错误是只委托给它所属的回调函数，例如下面这个例子。只有第一个回调函数接收到了错误信息，而第二个同样是按照预期的方式执行的并不会捕获第一个查询的错误：\n\n```js\nconnection.query('USE name_of_db_that_does_not_exist', function(err, rows) {\n  console.log(err.code); // 'ER_BAD_DB_ERROR'\n});\n\nconnection.query('SELECT 1', function(err, rows) {\n  console.log(err); // null\n  console.log(rows.length); // 1\n});\n```\n最后值得提醒的是,有时候你可以把错误处理不放在与查询一起的回调函数里面，就如同上面的那个例子。你可以把错误处理放在连接对象上的错误事件里面。就像下面这样：\n```js\nconnection.on('error', function(err) {\n  console.log(err.code); // 'ER_BAD_DB_ERROR'\n});\n\nconnection.query('USE name_of_db_that_does_not_exist');\n```\n注意:`error`在Node中是一个特殊的对象，如果它没有被挂在一个事件上而是单独出现，那么就很有可能出现堆栈错误并且关闭NodeJS程序进程.\n最后：这个模块处理错误的初衷都不是悄悄的处理掉错误，你应该把错误的处理放在回调函数里面。但是如果你不喜欢这么麻烦并且忽略掉错误。那么你可以这样做：\n```js\n// I am Chuck Norris:\nconnection.on('error', function() {});\n```\n##异常安全处理\n这个模块的异常处理很安全，也就是说在回调函数中抛出一个错误之后你可以使用’uncaughtException‘或域(domain)去捕获错误，然后继续的去使用做下面的事情。\n##类型转换\n为了您的使用方面，这个驱动会自动把MySQL中的一些类型转换为原生的javascript的类型。下面列举的是转换的类型：\n###Number\n\n* TINYINT\n* SMALLINT\n* INT\n* MEDIUMINT\n* YEAR\n* FLOAT\n* DOUBLE\n###Date\n\n* TIMESTAMP\n* DATE\n* DATETIME\n###Buffer\n\n* TINYBLOB\n* MEDIUMBLOB\n* LONGBLOB\n* BLOB\n* BINARY\n* VARBINARY\n* BIT (最后一个字节会使用0来填充)\n### String\n\n* CHAR\n* VARCHAR\n* TINYTEXT\n* MEDIUMTEXT\n* LONGTEXT\n* TEXT\n* ENUM\n* SET\n* DECIMAL (可能会超过float精度)\n* BIGINT (可能会超过float精度)\n* TIME (转换为日期, but what date would be set?)\n* GEOMETRY (从来没有用错，当你使用的时候你可以联系我们)\n  我们不建议你把类型转换这个参数禁用，但是如果你想禁用也可以在连接的时候就去做（这种方法可能在以后的版本中删除/改变）：\n```js\nvar connection = require('mysql').createConnection({typeCast: false});\n```\n或者在查询层做：\n```js\nvar options = {sql: '...', typeCast: false};\nvar query = connection.query(options, function(err, results) {\n\n});\n```\n你也可以通过一个处理函数来转换自己想要的类型，通过已知的一些字段的信息，像数据库，表名和字段名，数据类型和长度。如果你只想自己定义一个类型转换函数。你可以在查询的回调函数中做。例如你把TINYINT(1)转换为布尔值：\n```js\nconnection.query({\n  sql: '...',\n  typeCast: function (field, next) {\n    if (field.type == 'TINY' && field.length == 1) {\n      return (field.string() == '1'); // 1 = true, 0 = false\n    }\n    return next();\n  }\n});\n```\n__警告：你必须使用解析器中内建的三个field函数中的一个，在你自定义的类型转换回调函数中。他们只能调用一次：__\n```\nfield.string()\nfield.buffer()\nfield.geometry()\n```\n或者使用别名：\n```\nparser.parseLengthCodedString()\nparser.parseLengthCodedBuffer()\nparser.parseGeometryValue()\n```\n__如果你需要使用field函数，。你可以在RowDataPacket.prototype._typeCast中找到关于field函数的一些文档资料__\n\n##连接标记\n如果,由于某些原因你需要修改默认的连接标记,那么你可能需要使用flags选项。通过在连接配置的选项列表中添加这个选项，那么你就可以修改默认的连接标记.如果你不想使用默认的`flag`你可以使用一个减号来取消掉。或者在连接的配置选项列表里面添加一个flag选项，而不写值，仅仅就是一个flag名字在哪里（不区分大小写）。PS:不像去掉`flag`选项一样,在`flag`的前面加一个`+`号：\n**请注意：有些默认的flag目前还不支持（例如：SSL,Compression）。**\n例子：\n下面的例子是使用黑名单FOUND_ROWS flag例子：\n```js\nvar connection = mysql.createConnection(\"mysql://localhost/test?flags=-FOUND_ROWS\");\n```\n###默认标记\n- LONG_PASSWORD\n- FOUND_ROWS\n- LONG_FLAG\n- CONNECT_WITH_DB\n- ODBC\n- LOCAL_FILES\n- IGNORE_SPACE\n- PROTOCOL_41\n- IGNORE_SIGPIPE\n- TRANSACTIONS\n- RESERVED\n- SECURE_CONNECTION\n- MULTI_RESULTS\n- MULTI_STATEMENTS (如果使用` multipleStatements ` 选项就激活)\n###其他的可用标记\n- NO_SCHEMA\n- COMPRESS\n- INTERACTIVE\n- SSL\n- PS_MULTI_RESULTS\n- PLUGIN_AUTH\n- SSL_VERIFY_SERVER_CERT\n- REMEMBER_OPTIONS\n##调试与问题查看\n如果在运行过程中出现了问题，你可以在连接的配置选项中添加一个`debug`参数来帮助你调试：\n```js\nvar connection = mysql.createConnection({debug: true});\n```\n\n它会将输入的信息与输出的信息标准输出的显示出来，你还可以通过把数据包的类型转换成一个数据数组对象来方便调试:\n```js\nvar connection = mysql.createConnection({debug: ['ComQueryPacket', 'RowDataPacket']});\n```\n\n\n限制查询与数据包；\n如果没有帮助，你可以打开github的问答社区。一个好的GitHub问题有以下几个特征：\n* 提供能够重现该问题的代码（如果可以）\n* 尽可能的说清楚您的调试环境（MySQL版本，nodeJS版本，操作系统等等）。\n\n##运行单元测试\n设置环境变量`MYSQL_DATABASE`,` MYSQL_HOST`,` MYSQL_PORT`,` MYSQL_USER` 和` MYSQL_PASSWORD`。当你测试的时候你可以需要把这些配置放在一个`config.sh`文件或者是源代码中。然后运行`npm test`。\n例如，你安装的MySQL是运行在localhost:3306上面并且没有给root设置密码，那么你可以像下面这样做：\n```\nmysql -u root -e \"CREATE DATABASE IF NOT EXISTS node_mysql_test\"\n  MYSQL_HOST=localhost MYSQL_PORT=3306 MYSQL_DATABASE=node_mysql_test MYSQL_USER=root MYSQL_PASSWORD= make test\n```\n\n##备忘录\n* 预查询语句\n* 查询时调用 `setTimeout() `方法\n* 支持 UTF-8 / ASCII编码\n"
  },
  {
    "path": "pg.md",
    "content": "## PostgreSQL(数据库)资料\n\n![PostgreSQL](https://wiki.postgresql.org/images/3/30/PostgreSQL_logo.3colors.120x120.png)\n\nAbout:[PostgreSQL About](http://www.postgresql.org/about/)\n\n[《PostgreSQL 源码分析系列》](#pg_kernel)\n\n* <a name=\"pg_kernel\"/> PostgreSQL 源码分析系列\n\n介绍:PostgreSQL 源码分析系列文章\n\n* [《PG 内存上下文》](http://www.zhangxiaojian.name/?p=447)\n\n介绍：PG 内存上下文,[code](https://github.com/zhangxiaojian/memoryContext)\n\n* [《PostgreSQL及其代码的结构》](http://wiki.postgresql.org/wiki/Pgsrcstructure)\n\n介绍:PostgreSQL及其代码的结构\n\n* [《A Tour of PostgreSQL Internals》](http://www.postgresql.org/files/developer/tour.pdf)\n\n介绍:PostgreSQL内部的概览,可以结合上面的pg代码结构来阅读\n\n* [《PostgreSQL 中的 Json —从使用到源码》](http://www.zhangxiaojian.name/?p=317)\n\n介绍：PostgreSQL 中的 Json —从使用到源码\n\n* [《PostgreSQL锁机制分析》](http://mp.weixin.qq.com/s?__biz=MzIwNzEzNDkxNQ==&mid=400885298&idx=1&sn=76df79eff99131cf6e64991b1629e8c9&scene=7#wechat_redirect)\n\n介绍：PostgreSQL锁机制分析,[第二部分](http://mp.weixin.qq.com/s?__biz=MzIwNzEzNDkxNQ==&mid=400897914&idx=1&sn=e83f15ba1b62abfd9e01cd7b08b87cc7&scene=4#wechat_redirect)\n\n* [《FSM》](http://blog.chinaunix.net/uid-24774106-id-3764994.html)\n\n介绍：PostgreSQL源码分析之FSM\n\n* [《page》](http://blog.chinaunix.net/uid-24774106-id-3764606.html)\n\n介绍：PostgreSQL源码分析之page\n\n* [《shared buffer状态信息及性能测量 》](http://blog.chinaunix.net/uid-24774106-id-3761861.html)\n\n介绍：PostgreSQL源码分析之shared buffer状态信息及性能测量,推荐[shared buffer的分配与替换](http://blog.chinaunix.net/uid-24774106-id-3761272.html),[shared buffer与磁盘文件 ](http://blog.chinaunix.net/uid-24774106-id-3761123.html),[database和table 与磁盘文件的对应](http://blog.chinaunix.net/uid-24774106-id-3757916.html)\n\n* [《PostgreSQL内部结构与源代码研究索引页》](http://www.cnblogs.com/gaojian/p/3261568.html)\n\n介绍：文章包括pg_stat_statements源代码分析,PostgreSQL的hook机制初步学习,EDB*Plus的client_encoding问题,PostgreSQL的索引膨胀,libpq 与 fe-misc.c,libpq 练习的入口点,Autovacuum 的运行限制,autovacuum 与 vacuum full,autoanalyze 的注意事项,backuplabel file 初步学习,HOT（Heap-Only Tuples）,Checkpoint 发生的时机,checkpoint 活动,pg_buffercache 代码研究,内存结构图示,内存使用增长观察,使用cgroups来控制内存使用,调整内存与IO的参数说明,MVCC图示,ListenSocket 的研究\n\n* [《CreateLockFile》](http://blog.csdn.net/huguangshanse00/article/details/40479995)\n\n介绍：PostgreSQL CreateLockFile分析\n\n* [《动态Hash》](http://blog.csdn.net/li_shugan1/article/details/7975571)\n\n介绍：动态Hash\n\n* [《Postgres Internals Presentations》](http://momjian.us/main/presentations/internals.html)\n\n介绍: PG内部机制分析.\n\n* [《为PostgreSQL添加插件》](http://my.oschina.net/Suregogo/blog/550201)\n\n介绍: 利用pg的hook机制为pg添加插件.\n\n* [《PostgreSQL 优化器逻辑推理能力》](http://blog.163.com/digoal@126/blog/static/163877040201612374931160/)\n\n介绍: 源码解析.\n\n* [《postgres 源码分析之 insert(1)》](http://blog.csdn.net/huguangshanse00/article/details/37045847)\n\n介绍: Insert分析.\n\n* [《PostgreSQL查询处理部分源码分析》](http://7xtcs7.com1.z0.glb.clouddn.com/PostgreSQL%E6%9F%A5%E8%AF%A2%E5%A4%84%E7%90%86%E9%83%A8%E5%88%86%E6%BA%90%E7%A0%81%E5%88%86%E6%9E%90.pdf)\n\n介绍: PostgreSQL查询处理部分源码分析.\n\n* [《PostgreSQL查询处理部分源码分析》](http://www.docin.com/p-271989068.html)\n\n介绍:  PostgreSQL查询处理部分源码分析.\n\n* [《Understanding caching in Postgres》](https://madusudanan.com/blog/understanding-postgres-caching-in-depth/)\n\n介绍:Postgres缓存机制分析.\n\n* [《Discovering the Computer Science Behind Postgres Indexes》](https://blog.codeship.com/discovering-computer-science-behind-postgres-indexes/)\n\n介绍: Postgres索引分析,推荐先阅读[Efficient Locking for Concurrent Operations on B-Trees](http://www.csd.uoc.gr/~hy460/pdf/p650-lehman.pdf).\n\n* [《Estimating the Optimal Number of Latent Concepts in Source Code Analysis》](http://research.cs.queensu.ca/~cordy/Papers/GC_SCAM10_ConceptCount.pdf)\n\n介绍:Estimating the Optimal Number of Latent Concepts in Source Code Analysis.\n\n* [《Pgkernel》](https://wiki.postgresql.org/wiki/Pgkernel)\n\n介绍:Postgres内核分析系列文章\n\n>   :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple:  :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple:  :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple:  :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: :couple: \n\n* [《PostgreSQL Documentation》](http://www.postgresql.org/docs/manuals/)\n\n介绍：PostgreSQL官方文档主页\n\n* [《PG技术沙龙ppt》](http://wenku.it168.com/org/145)\n\n介绍：2013年4月PG技术沙龙PPT\n\n* [《PG9.4.4中文翻译文档》](http://postgres.cn/docs/9.4/)\n\n介绍：PG9.4.4中文翻译文档\n\n* [《Database System Concepts Sixth Edition》](http://codex.cs.yale.edu/avi/db-book/)\n\n介绍：数据库系统概念(第六版)\n\n* [《PostgreSQL从菜鸟到专家(中译稿 by 洞庭湖的泥鳅)》](http://download.csdn.net/detail/lusizeng/8679303)\n\n介绍：这篇文档是国内的一线postgreSQL专家所翻译。很经典\n\n* [《PostgreSQL vs. MS SQL Server》](http://www.pg-versus-ms.com/)\n\n介绍：PostgreSQL与 MS SQL Server的对比,[中文版](http://www.oschina.net/translate/postgresql-vs-ms-sql-server)\n\n* [《PostgreSQL 30天 培训视频》](https://github.com/digoal/blog/blob/master/README.md)\n\n介绍：作者[德哥@Digoal](https://github.com/digoal/blog)从事pg截止目前大概有7-8年，长期活跃在国内的pg社区。这套PostgreSQL 30天 培训视频包含了SQL基础,备份恢复,HA,服务端编程,大数据,内核,应用案例等，非常适合新手\n\n* [《PostgreSQL爱好者的参考资料推荐》](https://github.com/digoal/blog/blob/master/201611/20161101_01.md)\n\n介绍：PostgreSQL爱好者的参考资料推荐\n\n* [《PostgreSQL Studio》](http://www.postgresqlstudio.org/)\n\n介绍：PostgreSQL Studio 是开源的 PostgreSQL 数据库的 Web 接口。可以让你直接在浏览器上编辑数据库代码，浏览数据库模型和运行 SQL 语句。这是一个数据库管理工具，侧重于开发。\n\n* [《PostgreSQL Query Cache》](http://code.google.com/p/pqc/)\n\n介绍：PostgreSQL Query Cache 一个新的开源软件，用来极速提升 PostgreSQL 数据库的查询性能，通过缓存查询结果，可提升 10 ~ 100 倍。\n\n* [《py-postgresql》](http://python.projects.pgfoundry.org/)\n\n介绍：Python的PostgreSQL驱动。\n\n* [《Postgres-XL》](http://www.postgres-xl.org/)\n\n介绍： 一个构建PostgreSQL集群开源软件,Postgres-XL is a PostgreSQL-based scale-out cluster that handles both OLTP write intensive workloads as well as OLAP/BI type of workloads thanks to MPP parallelism.。\n\n* [《pgDesigner》](http://sourceforge.net/projects/pgdesigner/)\n\n介绍：pgDesigner 是一个为PostgreSQL数据库设计的建模工具.仅支持Linux。\n\n* [《pgweb》](https://github.com/sosedoff/pgweb/)\n\n介绍：一个采用 Go 语言开发的基于 Web 的 PostgreSQL 管理系统。\n\n* [《pgwatch》](http://www.cybertec.at/postgresql_produkte/pgwatch-cybertec-enterprise-postgresql-monitor/)\n\n介绍：一个简单易用的 PostgreSQL 的监控工具，支持 PostgreSQL 9.0 以及更新的版本。\n\n* [《pgpool-II》](http://www.pgpool.net/mediawiki/index.php/Main_Page)\n\n介绍：pgpool-II 是运行于 PostgreSQL 数据库服务器和客户端之间的一个中间件，提供的功能包括：连接池、复制、负载均衡、客户端限制和并行查询等。\n\n* [《pgCluu》](http://pgcluu.darold.net/)\n\n介绍：pgCluu 是一个对 PostgreSQL 集群性能进行完整审计的工具，该工具分为两部分：\n1. collector 收集器用于从 PostgreSQL 集群中获取统计数据，使用 psql 和 sar 工具\n2. grapher 关于生成 HTML 报表和图表 数据库服务器和客户端之间的一个中间件，提供的功能包括：连接池、复制、负载均衡、客户端限制和并行查询等。\n\n* [《cstore_fdw》](https://github.com/citusdata/cstore_fdw)\n\n介绍：cstore_fdw 实现了 PostgreSQL 数据库的柱状存储，用于对批量加载的数据进行分析的场景。\n\n* [《Barman for PostgreSQL》](http://www.pgbarman.org/)\n\n介绍：Barman (备份和恢复管理器) for PostgreSQL 是 PostgreSQL 数据库服务器的灾难恢复工具，允许远程备份多个服务器，帮助 DBA 在数据恢复阶段的关键工作。\n\n* [《pgFouine》](http://www.pgbarman.org/)\n\n介绍：pgFouine 是一个 PostgreSQL 的日志分析软件，可以让你对 PostgreSQL 数据库的运行状态有个清晰的了解，同时对一些慢查询、使用频率最高的查询、错误生成相应的报表和图表。\n\n* [《Substitute PostgreSQL for Your NoSQL Needs》](http://news.dice.com/2014/11/24/substitute-postgresql-nosql-needs/)\n\n介绍：用PostgreSQL替换你的NoSQL。\n\n* [《Representing Trees in PostgreSQL》](http://woss.name/articles/representing-trees-in-postgresql/)\n\n介绍：Representing Trees in PostgreSQL\n\n* [《Michael Paquier》](http://michael.otacoo.com/)\n\n介绍：推荐一个博客，作者是一位日本的开发者。但是文章写的挺好的。是英文！！\n\n* [《Using Writeable CTEs to Improve Performance in PostgreSQL 》](http://omniti.com/seeds/writable-ctes-improve-performance)\n\n介绍：使用CTEs来提升你的数据库性能\n\n* [《Fast pagination on PostgreSQL》](http://chrisdone.com/posts/postgresql-pagination )\n\n介绍：PostgreSQL的快速分页\n\n* [《Upgrading your PostgreSQL cluster from 9.3 to 9.4 》](https://www.florian-schlachter.de/post/upgrading-postgres-9-3-9-4/)\n\n介绍：把你的PostgreSQL集群从9.3升级到9.4.\n\n* [《Making PostgreSQL scale Hadoop-style: Benchmark numbers》](http://www.citusdata.com/blog/86-making-postgresql-scale-hadoop-style)\n\n介绍：Making PostgreSQL scale Hadoop-style: Benchmark numbers\n\n* [《So You Want Another PostgreSQL Database？》](http://engineroom.trackmaven.com/blog/so-you-want-another-postgresql-database-part-1)\n\n介绍：还有[part2](http://engineroom.trackmaven.com/blog/so-you-want-another-postgresql-database-part-2/)\n\n* [《PostgreSQL Rising》](http://rob.conery.io/2012/07/19/postgresql-rising/)\n\n介绍：PostgreSQL的成长\n\n* [《Simple API with Nginx and PostgreSQL》](http://rny.io/nginx/postgresql/2013/07/26/simple-api-with-nginx-and-postgresql.html)\n\n介绍：如何建一个简单的REST API 仅仅使用 Nginx 和 PostgreSQL.如果不理解REST API这里推荐[RESTful API 设计指南](http://www.ruanyifeng.com/blog/2014/05/restful_api.html)、[理解RESTful架构](http://www.ruanyifeng.com/blog/2011/09/restful.html)\n\n* [《hypervault》](https://github.com/tetsuo/hypervault)\n\n介绍：PostgreSQL connection manager for scalability freaks.\n\n* [《PostgreSQL as a benchmarking tool》](https://www.pgcon.org/2014/schedule/attachments/309_PG_as_bench_mark.pdf)\n\n介绍：PostgreSQL as a benchmarking tool\n\n* [《2014年 PGcon会议paper》](http://www.pgcon.org/2014/schedule/index.en.html)\n\n介绍：2014年 PGcon会议paper，进去之后你还可以发现往年的paper。\n\n* [《PSequel》](http://www.psequel.com/)\n\n介绍： Mac OS X端的PostgreSQL图形管理工具\n\n* [《PostgreSQL’s Powerful New Join Type:LATERAL》](http://blog.heapanalytics.com/postgresqls-powerful-new-join-type-lateral/)\n\n介绍： PostgreSQL’s Powerful New Join Type: LATERAL，这个类型是在9.3的版本中开始的。\n\n* [《PostgreSQL Hardware Performance Tuning》](http://momjian.us/main/writings/pgsql/hw_performance/)\n\n介绍：PostgreSQL的硬件性能调优。\n\n* [《PostgreSQL: Introduction and Concepts Bruce Momjian》](http://momjian.us/main/writings/pgsql/aw_pgsql_book/)\n\n介绍：入门型电子书籍,书有点老了2001年的了。此外这本书的作者还有一个[资源页](http://momjian.us/main/writings/pgsql/)，里面有很多的干货。作者是enterpriseDB的工程师。经典文章还有[Writing PostgreSQL Applications](http://momjian.us/main/writings/pgsql/writing_apps.pdf).\n\n* [《Compiling PLV8 with Postgres Plus Advanced Server》](http://blogs.enterprisedb.com/2014/12/03/compiling-plv8-with-postgres-plus-advanced-server-2/)\n\n介绍：[什么是PLV8？](https://code.google.com/p/plv8js/wiki/PLV8),魅力就是:用js写SQL\n\n* [《fosdem 2014年PostgreSQL议题(含视频)》](https://archive.fosdem.org/2014/schedule/track/postgresql/)\n\n介绍:[fosdem](http://en.wikipedia.org/wiki/FOSDEM)是一个开源性组织,这个只是会议的一部分，从2001年开始到目前历经13年的[资料](https://archive.fosdem.org/)都被保存着，如果你有需要可以自己去翻阅。干货很多，另外2015年的议题已经开始筹备了[官方地址](https://fosdem.org/2015/)\n\n*[《PostgreSQL Now Has Logical Decoding》](http://rhaas.blogspot.jp/2014/03/postgresql-now-has-logical-decoding.html)\n\n介绍：PostgreSQL Now Has Logical Decoding,此外作者也是一位enterpriseDB的工程师，他的其他[博文](http://rhaas.blogspot.jp/)也很精彩.\n\n* [《美国2014年pgconf paper》](http://www.pgconf.us/2014/schedule/)\n\n介绍：美国2014年pgconf paper。\n\n* [《mysql2postgres》](https://github.com/maxlapshin/mysql2postgres)\n\n介绍：把MySQL迁移至postgreSQL?不如试试这个工具吧\n\n* [《What are the advantages and disadvantages of using PostgreSQL over MySQL?》](https://www.quora.com/What-are-the-advantages-and-disadvantages-of-using-PostgreSQL-over-MySQL)\n\n介绍：使用PG与MySQL比较有那些有点和缺点？\n\n* [《Postgres full-text search is Good Enough!》](http://blog.lostpropertyhq.com/postgres-full-text-search-is-good-enough/)\n\n介绍：Postgres的全文查询其实也很棒：多语言支持，模糊查询等，这篇文章说的很详细。而且里面有很多实际例子\n\n* [《PostgreSQL Security Audit》](http://security.stackexchange.com/a/2536)\n\n介绍：数据库安全问题一直是一个问题热门话题，PostgreSQL资料更是少之有少。这篇文章值得推荐。建议多多留意[postgresql security Vulnerabilities](http://www.cvedetails.com/vulnerability-list/vendor_id-336/product_id-575/Postgresql-Postgresql.html)、[Vulnerability handling in the PostgreSQL project](http://lwn.net/Articles/546550/)、[Security for PostgreSQL explain plans](https://docs.newrelic.com/docs/apm/traces/transaction-traces/security-postgresql-explain-plans)、[Row security in PostgreSQL](http://blog.2ndquadrant.com/postgresql-row-security-overview/)\n\n* [《使用oracle_fdw进行增量数据迁移的神奇方法》](http://blog.osdba.net/525.html)\n\n介绍:Oracle增量数据迁移到postgres方法，此外博主还有其他非常棒的文章。推荐也可以看看\n\n* [《Ware Yosemite? Possible PostgreSQL upgrade issues in OS X 10.10》](http://blog.2ndquadrant.com/ware-yosemite-possible-postgresql-upgrade-issues-os-x-10-10/)\n\n介绍:PostgreSQL升级在 Yosemite出现问题？可以参考一下这里。同样的也还有其他的文章也很不错\n\n* [《Open source developer based in Japan》](http://michael.otacoo.com/)\n\n介绍:如题，是日本一个开源项目博客，里面有很多postgresql的最新特性介绍(截止目前2014.12.13已有pg9.5的特性预览了)\n\n* [《PGXN: PostgreSQL Extension Network》](http://pgxn.org/)\n\n介绍:一个存放PostgreSQL扩展库的资源库,很多扩展插件都能够在这个里面找到\n\n* [《GP GPU  Accelerates PostgreSQL》](http://www.slideshare.net/kaigai/gpgpu-accelerates-postgresql)\n\n介绍：GPU对pg数据库的加速优化\n\n* [《Porting Oracle Applications to PostgreSQL》](http://www.slideshare.net/petereisentraut/porting-oracle-applications-to-postgresql)\n\n介绍：从Oracle迁移到pg，此外该作者还有一篇迁移的[ppt](http://www.slideshare.net/petereisentraut/porting-applications-from-oracle-to-postgre-sql).\n\n* [《Building and Distributing PostgreSQL Extensions Without Learning C》](http://www.slideshare.net/justatheory/building-and-distributing-postgresql-extensions-without-learning-c)\n\n介绍：即使没有C，你也可以扩展pg\n\n* [《PagerDuty analytics with Postgres》](https://stripe.com/blog/pagerduty-analytics-with-pd2pg)\n\n介绍：使用PagerDuty做pg分析\n\n* [《Syncing Postgres to Elasticsearch: lessons learned》](https://gocardless.com/blog/syncing-postgres-to-elasticsearch-lessons-learned/)\n\n介绍：Elasticsearch是一个实时的分布式搜索和分析引擎,这篇文章是讲述作者在做pg同步到Elasticsearch的时候的一些经验之谈，如果有相关需要的建议阅读．如果不明白什么是E[lasticsearch](http://www.elasticsearch.org/)，可以先看看[Elasticsearch权威指南](http://fuxiaopang.gitbooks.io/learnelasticsearch/)\n\n* [《pypgTAP》](https://github.com/itissid/pypgTAP)\n\n介绍：Making Postgres coding and testing fun!\n\n* [《Backuping PostgreSQL with Docker》](http://geoffrey.io/backuping-postgresql-in-docker.html)\n\n介绍：备份基于Docker的PostgreSQL数据库,国内有[中文版](http://dockerone.com/article/118)\n\n* [《postgresql 9.0 memory processes》](http://raghavt.blogspot.com/2011/04/postgresql-90-memory-processes.html)\n\n介绍：PostgreSQL 9.0 内存 & 进程，感觉英语吃力的朋友可以阅读[中文版](http://dreamer-yzy.github.io/2015/01/09/-%E7%BF%BB%E8%AF%91-PostgreSQL-9-0-%E5%86%85%E5%AD%98-%E8%BF%9B%E7%A8%8B/)\n\n* [《postgresql 9.0 architecture》](http://raghavt.blogspot.com/2011/04/postgresql-90-architecture.html)\n\n介绍： 本篇文章讲述了PostgreSQL 9.0 构架，[中文版](http://dreamer-yzy.github.io/2015/01/08/-%E7%BF%BB%E8%AF%91-PostgreSQL-9-0-%E6%9E%84%E6%9E%B6/)\n\n* [《Deadlocks in PostgreSQL》](http://raghavt.blogspot.com/2011/11/deadlocks-in-postgresql.html)\n\n介绍： PostgreSQL中的死锁，[中文版](http://dreamer-yzy.github.io/2015/01/14/-%E7%BF%BB%E8%AF%91-PostgreSQL%E4%B8%AD%E7%9A%84%E6%AD%BB%E9%94%81/)\n\n* [《PostgreSQL 9.0 Backup & Recovery》](http://raghavt.blogspot.com/2011/05/postgresql-90-backup-recovery.html)\n\n介绍： 本篇文章讲述了PostgreSQL 9.0 备份 & 恢复架，[中文版](http://dreamer-yzy.github.io/2015/01/13/-%E7%BF%BB%E8%AF%91-PostgreSQL-9-0-%E5%A4%87%E4%BB%BD-%E6%81%A2%E5%A4%8D/)\n\n* [《将数据从PostgreSQL同步到Elasticsearch的经验总结》](http://www.infoq.com/cn/news/2015/01/postgresql-elasticsearch)\n\n介绍： 将数据从PostgreSQL同步到Elasticsearch的经验总结\n\n* [《数据库相论文推荐》](http://www.vldb.org/pvldb/vol6/)\n\n介绍： 索引，查询，磁盘，优化，挖掘，集群，数据恢复，高可用，高性能等等，这些仅仅是一部分而已，在[主页](http://www.vldb.org/pvldb/)上面有2014年一年的数据库相关论文\n\n* [《pgloader》](http://pgloader.io/)\n\n介绍： postgresql的一数据导入工具，支持csv, 数据迁移\n\n* [《mysql schema to postgresql》](https://github.com/mihailShumilov/mysql2postgresql)\n\n介绍：Converter mysql schema and data to postgresql\n\n* [《Search PostgreSQL sites》](http://www.pgsql.ru/db/pgsearch/)\n\n介绍：一个PostgreSQL资料搜索引擎.\n\n* [《PostgreSQL Tutorial》](http://www.postgresqltutorial.com/)\n\n介绍：一个PostgreSQL入门教程站点，新手上路.\n\n* [《PostgreSQL: CLUSTER table USING index》](http://hans.io/blog/2014/03/25/postgresql_cluster/)\n\n介绍：对CLUSTER表使用索引.\n\n* [《When Postgres will not start》](http://blog.endpoint.com/2014/11/when-postgres-will-not-start.html)\n\n介绍：当数据库无法启动的时候,我们应该如何做.\n\n* [《Postgres and Connection Pooling》](http://www.craigkerstiens.com/2014/05/22/on-connection-pooling/)\n\n介绍：作者的[博客](http://www.craigkerstiens.com/)还有很多干货.\n\n* [《PgBouncer》](https://pgbouncer.github.io/)\n\n介绍：PGBouncer是一个轻量级的针对PostgreSQL的数据库连接池工具，能够给客户端提供一个统一的链接视图.\n\n* [《PGQ 》](https://wiki.postgresql.org/wiki/PGQ_Tutorial)\n\n介绍：PGQ is the queueing solution from Skytools. The Londiste replication solution is a consumer daemon built on PGQ, and the API is accessible for you to create any asynchronous processing facility, based on queuing.[github](https://github.com/kostya/pgq).\n\n* [《Implementing High Availability with PostgreSQL》](https://www.youtube.com/watch?v=j642n39oBgQ)\n\n介绍：实现一个高可用PostgreSQL集群,YoutuBe上更多[PostgreSQL cluster](https://www.youtube.com/results?search_query=postgresql+cluster)视频.\n\n* [《numtel:pg》](https://github.com/numtel/meteor-pg)\n\n介绍：Reactive PostgreSQL for Meteor.\n\n* [《Slow PostgreSQL Performance? Don't Forget to Vacuum your Database》](https://lob.com/blog/supercharge-your-postgresql-performance/)\n\n介绍：数据库性能优化之Vacuum.\n\n* [《select * from depesz;》](http://www.depesz.com/)\n\n介绍：里面有很多pg的最新资料,例如新版本的功能,技巧等.\n\n* [《BDR 0.10.0 Documentation》](http://bdr-project.org/docs/next/index.html)\n\n介绍：[BDR](http://2ndquadrant.com/en/resources/bdr/)新的文档,使用的数据库版本是9.4的,BDR可以帮助你更好的建立一个pg集群.\n\n* [《Managing big enough data in postgres》](http://blog.tarkalabs.com/2015/04/16/managing-big-enough-data-in-postgres/)\n\n介绍：pg中的大规模数据管理经验.\n\n* [《Database System Concepts Sixth Edition》](http://codex.cs.yale.edu/avi/db-book/)\n\n介绍：耶鲁大学的数据库系统概念课件.\n\n* [《Hooks in PostgreSQL》](https://wiki.postgresql.org/images/e/e3/Hooks_in_postgresql.pdf)\n\n介绍：PostgreSQL的hook机制介绍.如果有困难可以先看看[简单的使用介绍](http://www.cnblogs.com/gaojian/p/3259147.html)，此外这位博主的[其他pg文章](http://www.cnblogs.com/gaojian/p/topindex.html)也不错.\n\n* [《The design of the postgres storage system》](http://www.postgresql.org.es/sites/default/files/ERL-M87-06.pdf)\n\n介绍：Postgres存储系统设计论文.\n\n* [《The design of the postgres》](http://www.postgresql.org.es/sites/default/files/ERL-M85-95.pdf)\n\n介绍：Postgres设计论文.\n\n* [《The Design of the POSTGRES Rules System》](http://www.postgresql.org.es/sites/default/files/ERL-M85-95.pdf)\n\n介绍：The Design of the POSTGRES Rules System.\n\n* [《PostgreSQL官方推荐文献》](http://www.postgresql.org/docs/devel/static/biblio.html)\n\n介绍：PostgreSQL官方推荐文献.\n\n* [《Anatomy of a Database System》](http://wshan.net/bigdata/read1.pdf)\n\n介绍：数据库内部结构剖析.\n\n* [《PGtune》](http://pgtune.leopard.in.ua/)\n\n介绍：PostgreSQL性能调优工具,只需要输入机器配置即可获得相应的推荐优化参数.\n\n* [《PostgreSQL performance considerations》](https://robots.thoughtbot.com/postgresql-performance-considerations)\n\n介绍：很多讲 PostgreSQL 优化的文章都提到了 Partial indexes[Partial indexes](http://www.postgresql.org/docs/9.4/static/indexes-partial.html)，简单的说，它是一个通过 WHERE 过滤后的子集数据的索引，虽然 MySQL 里也有这个名词，但完全不是一个东西。案例：㈠ [Handling Growth with Postgres: 5 Tips From Instagram](http://instagram-engineering.tumblr.com/post/40781627982/handling-growth-with-postgres-5-tips-from) ㈡ [Speeding Up PostgreSQL With Partial Indexes](http://blog.heapanalytics.com/speeding-up-postgresql-queries-with-partial-indexes/).\n\n* [《Postgres Guide》](http://www.postgresguide.com/index.html)\n\n介绍：Postgres的指南主要强调在Postgre存在的最佳实践和强大的功能.\n\n* [《PostgreSQL Performance Tuning》](http://linuxfinances.info/info/postgresqlperformance.html)\n\n介绍：PostgreSQL性能调优,作者的其他[关于PostgreSQL文章](http://linuxfinances.info/info/postgresql.html)也不错.\n\n* [《PostgreSQL Backend Flowchart》](http://www.postgresql.org/developer/backend/)\n\n介绍： PostgreSQL 内核学习.\n\n* [《PostgreSQL Vulnerability》](http://cve.mitre.org/cgi-bin/cvekey.cgi?keyword=postgresql)\n\n介绍： PostgreSQL漏洞库.\n\n* [《Full text search in milliseconds with PostgreSQL》](https://blog.lateral.io/2015/05/full-text-search-in-milliseconds-with-postgresql/)\n\n介绍： PostgreSQL毫秒级全文本搜索.\n\n* [《Annotated postgresql.conf and Global User Configuration (GUC) Guide》](http://www.varlena.com/GeneralBits/Tidbits/annotated_conf_e.html)\n\n介绍： postgresql.conf配置文件注释.\n\n* [《Bottled Water: Real-time integration of PostgreSQL and Kafka》](http://blog.confluent.io/2015/04/23/bottled-water-real-time-integration-of-postgresql-and-kafka/)\n\n介绍：利用Postgres 9.4的新功能Logical Decoding，实时stream所有SQL操作到Kafka，然后下游的各种consumer从Kafka中接收。其实就是Write-ahead logging的广义应用\n\n* [《Is PostgreSQL Your Next JSON Database?》](https://www.compose.io/articles/is-postgresql-your-next-json-database/)\n\n介绍： Is PostgreSQL Your Next JSON Database?.\n\n* [《NoSQL with PostgreSQL 9.4 and JSONB》](http://blog.2ndquadrant.com/nosql-postgresql-9-4-jsonb/)\n\n介绍： NoSQL with PostgreSQL 9.4 and JSONB.\n\n* [《PostgreSQL, the NoSQL Database》](http://www.linuxjournal.com/content/postgresql-nosql-database)\n\n介绍： PostgreSQL, the NoSQL Database.\n\n* [《How to update large tables in PostgreSQL》](http://blog.codacy.com/2015/05/14/how-to-update-large-tables-in-postgresql/)\n\n介绍： PostgreSQL如何更新大表.\n\n* [《PostgreSQL:Error Message Style Guide》](http://www.postgresql.org/docs/devel/static/error-style-guide.html)\n\n介绍： PostgreSQL错误信息编码指南.\n\n* [《Compressing PostgreSQL JSONB data 12x using cstore_fdw》](https://www.citusdata.com/blog/156-compressing-jsonb-using-cstore-fdw)\n\n介绍： cstore_fdw压缩PostgreSQL数据.\n\n* [《PostgreSQL: the good, the bad, and the ugly》](http://lwn.net/SubscriberLink/645020/e1ba36cff8248df0/)\n\n介绍： PostgreSQL评价.\n\n* [《SQLPro for PostgresSQL》](http://www.hankinsoft.com/SQLProPostgres/)\n\n介绍： Mac OS X上的PostgreSQL管理器.\n\n* [《PostgreSQL 9.5's Upsert Feature Explained》](https://www.youtube.com/watch?v=pbg97bkxbbY&utm_source=postgresweekly&utm_medium=email)\n\n介绍: PostgreSQL 9.5新特性Upsert解释 .\n\n* [《PostgreSQL database replication》](http://www.vertabelo.com/blog/technical-articles/postgresql-database-replication)\n\n介绍:PostgreSQL的复制.\n\n* [《YeSQL: Battling the NoSQL Hype Cycle with Postgres》](http://momjian.us/main/blogs/pgblog/2015.html)\n\n介绍： YeSQL: Battling the NoSQL Hype Cycle with Postgres,博客的[其他内容](http://momjian.us/main/blogs/pgblog/2015.html)也不错.\n\n* [《pgTAP》](http://pgtap.org/)\n\n介绍:pgTAP is a unit testing framework for PostgreSQL written in PL/pgSQL and PL/SQL.\n\n* [《Practical PostgreSQL》](http://www.commandprompt.com/ppbook/?page=ppbook)\n\n介绍: 免费的pg电子书《PostgreSQL实践》,书虽然有点老,但是很多知识点是可以通用的.\n\n* [《PostgreSQL: Introduction and Concepts》](http://momjian.us/main/writings/pgsql/aw_pgsql_book/)\n\n介绍:PostgreSQL介绍与入门,免费在线电子书,[pdf版](http://momjian.us/main/writings/pgsql/bookfigs.pdf),入门的还有[Get to know PostgreSQL](http://momjian.us/main/writings/pgsql/Get_to_know_PostgreSQL.pdf).\n\n* [《Mastering PostgreSQL Administration》](http://momjian.us/main/writings/pgsql/administration.pdf)\n\n介绍:PostgreSQL管理入门,非常全,此外作者写了很多关于pg的[ppt和文档](http://momjian.us/main/writings/pgsql/),也很精彩.\n\n* [《Postgres-XC》](https://wiki.postgresql.org/wiki/Postgres-XC)\n\n介绍: Postgres-XC 是一种提供写可靠性,多主节点数据同步,数据传输的开源集群方案.\n\n* [《PGCon 2015 演讲稿》](http://www.pgcon.org/2015/schedule/)\n\n介绍: PGCon 2015 演讲稿下载.\n\n\n* [《PostgreSQL Shutdown》](http://www.enterprisedb.com/postgres-plus-edb-blog/robert-haas/postgresql-shutdown)\n\n介绍: PG停止服务评析.\n\n* [《First Rule in Securing Postgres: Don’t Be Dumb》](http://www.enterprisedb.com/postgres-plus-edb-blog/robert-haas/first-rule-securing-postgres-don-t-be-dumb)\n\n介绍: pg的安全规则建议,共5点,第一点就是Don’t be dumb!,enterprisedb的[官方博客](http://www.enterprisedb.com/postgres-plus-edb-blog)资源还真的比较丰富,例如还有中文版的[Postgres Plus Advanced Server与oracle兼容文档](http://www.enterprisedb.com/docs/cn/8.3R2/oracompat/EnterpriseDB_OraCompat_8.3_CN-01.htm).\n\n* [《Serializable Snapshot Isolation in PostgreSQL》](http://arxiv.org/pdf/1208.4179v1.pdf)\n\n介绍: PG中的可串行化快照隔离.\n\n* [《Converting from other Databases to PostgreSQL》](https://wiki.postgresql.org/wiki/Converting_from_other_Databases_to_PostgreSQL)\n\n介绍: 其他数据库向psotgresql迁移数据的工具,官方出品，包括 MySQL, MS SQL Server, SQL Azure, Oracle, MS Access.等.\n\n* [《深度学习PostgreSQL》](http://pan.baidu.com/s/1bnnqEHx)\n\n介绍: 从安装到双机热备再到内核分析,内容丰富网盘提取密码`fmby`.\n\n* [《Postgres CLI with autocompletion and syntax highlighting》](http://pgcli.com/)\n\n介绍: pgcli是一个PostgreSQL命令行工具,提供了语法高亮以及自动补全的功能.\n\n* [《Postgres Guid》](http://postgresguide.com/)\n\n介绍: Postgres入门指南,从安装到优化,也讲到了非标准数据类型JSON,hstor等.\n\n* [《Efficient Use of PostgreSQL Indexes》](https://devcenter.heroku.com/articles/postgresql-indexes#partial-indexes)\n\n介绍: 本文介绍了如何高效的使用pg的索引,很详细.讲到了很多容易被初学者容易疏忽的地方.\n\n* [《PostgreSQL学习手册(目录)》](http://www.cnblogs.com/stephen-liu74/archive/2012/06/08/2315679.html)\n\n介绍: PostgreSQL学习手册,虽然是2012年的,但里面的内容与现在的最新版pg是兼容,可以正常使用的.\n\n* [《\"Big data\" features coming in PostgreSQL 9.5》](http://lwn.net/Articles/653411/)\n\n介绍: PostgreSQL9.5中对于大数据的有利特性介绍.\n\n* [《PostgreSQL-The Bits You Haven't Found》](http://postgres-bits.herokuapp.com/)\n\n介绍: PostgreSQL中可能你还不知道的秘密,可以用作知识梳理.\n\n* [《Designing A PostgreSQL Document API》](http://rob.conery.io/2015/08/20/designing-a-postgresql-document-api/)\n\n介绍: 自己动手设计一个PostgreSQL文档api.\n\n* [《10 beginner's PostgreSQL tasks you should know》](https://eye.raze.mx/10-beginner-postgresql-tasks-you-should-know/)\n\n介绍: PostgreSQL初学者快速入门要点.\n\n* [《SQL vs NoSQL KO. Postgres vs Mongo》](https://www.airpair.com/postgresql/posts/sql-vs-nosql-ko-postgres-vs-mongo)\n\n介绍: 关系型数据库Postgres vs NoSQL 数据库Mongo的对决,这篇文章比较客观.\n\n* [《EnterpriseDB认证通关攻略》](http://blog.chinaunix.net/uid-20726500-id-4454943.html)\n\n介绍:如果你想考EnterpriseDB认证,推荐阅读此篇文章.\n\n* [《sql_firewall: a SQL Firewall Extension for PostgreSQL》](https://github.com/uptimejp/sql_firewall)\n\n介绍:这个插件可以更好的帮助你防御黑客攻击你的数据库.\n\n* [《Aquameta Layer 0: meta - Writable System Catalog for PostgreSQL》](http://blog.aquameta.com/2015/08/29/intro-meta/)\n\n介绍:Aquameta的pg实践.\n\n* [《Postgres Weekly》](http://postgresweekly.com/)\n\n介绍:国外的PostgreSQL周刊,每周的pg新鲜事.\n\n* [《PostgreSQL, pg_shard, and what we learned from our failures》](https://www.citusdata.com/blog/19-ozgun/265-postgresql-pgshard-and-what-we-learned-our-failures)\n\n介绍:pg_shard的经验分享.\n\n* [《REST API for any Postgres database》](https://github.com/begriffs/postgrest)\n\n介绍:pg的一个非官方REST API,此外推荐[RADIP RESTful API for PostgreSQL](https://github.com/QBisConsult/psql-api).\n\n* [《Pg_clog异步提交一致性、原子操作与fsync》](http://mysql.taobao.org/monthly/2015/09/02/)\n\n介绍:Pg_clog分析.\n\n* [《Pg的checkpoint的调度》](http://mysql.taobao.org/monthly/2015/09/06/)\n\n介绍:同步机制分析.\n\n* [《PostgreSQL Foreign Data Wrappers》](https://www.kentik.com/postgresql-foreign-data-wrappers/)\n\n介绍:PostgreSQL外部数据封装器介绍.\n\n* [《Following a Select Statement Through Postgres Internals》](http://patshaughnessy.net/2014/10/13/following-a-select-statement-through-postgres-internals)\n\n介绍:SELECT查询如何在PostgreSQL内部工作的.\n\n* [《PipelineDB—The Streaming SQL Database》](https://www.pipelinedb.com/)\n\n介绍:PipelineDB是基于PostgreSQL研发的一种流式关系数据库.\n\n* [《PostgreSQL：A Platform for Multiple Sources Data Retrieval》](https://abdulyadi.files.wordpress.com/2015/10/ictvetpaper.pdf)\n\n介绍:使用pg完成多平台数据源检索,[幻灯片](https://abdulyadi.files.wordpress.com/2015/10/presentation.pdf).\n\n* [《Column-Stores vs. Row-Stores: How Different Are They Really?》](http://db.csail.mit.edu/projects/cstore/abadi-sigmod08.pdf)\n\n介绍:列式存储与行式存储数据库之间究竟有何区别？.\n\n* [《Pivotal Greenplum Database has been open sourced》](https://github.com/greenplum-db/gpdb)\n\n介绍:基于PostgreSQL的Greenplum Database数据仓库开源.\n\n* [《PostgreSQL 数据库文档》](http://pgsqlcn.com/index.html)\n\n介绍:PostgreSQL数据库文档,文档内容基于9.5版本演示.\n\n* [《More Concurrency: Improved Locking In PostgreSQL》](http://highscalability.com/blog/2015/10/13/more-concurrency-improved-locking-in-postgresql.html)\n\n介绍:pg高并发在锁方面的改善，[中文版](http://www.csdn.net/article/2015-11-07/2826143).\n\n* [《SQL Tabs 》](http://www.sqltabs.com/)\n\n介绍:PostgreSQL的跨平台终端.\n\n* [《Writing Postgres Extensions - Debugging》](http://big-elephants.com/2015-10/writing-postgres-extensions-part-iii/)\n\n介绍:PostgreSQL插件开发.\n\n* [《PostgreSQL: A full text search engine》](http://shisaa.jp/postset/postgresql-full-text-search-part-1.html)\n\n介绍:PostgreSQL全文搜索引擎剖析[part2](http://shisaa.jp/postset/postgresql-full-text-search-part-2.html),[part3](http://shisaa.jp/postset/postgresql-full-text-search-part-3.html).\n\n* [《PostgreSQL-Consulting.com》](http://blog.postgresql-consulting.com/)\n\n介绍:这是一个PG商业顾问的博客，里面提供的pg性能调优，部署，迁移等博文.\n\n* [《PostgreSQL Planet》](http://planet.postgresql.org/)\n\n介绍:PostgreSQL官方的一个pg文章news.\n\n* [《Benchmarking Postgres-XL》](http://blog.2ndquadrant.com/benchmarking-postgres-xl/)\n\n介绍:Postgres-XL压力测试分析,博客中的[其他内容](http://blog.2ndquadrant.com/)也很有料.\n\n* [《PostgreSql Database Video Tutorials》](https://www.youtube.com/playlist?list=PLFRIKEguV54bgwAcgFiOs5GMo3q2DhVDj)\n\n介绍:PostgreSQL视频教程.\n\n* [《PostgreSQL Replication Tutorial》](https://www.youtube.com/watch?v=GobQw9LMEaw)\n\n介绍：PostgreSQL Replication Tutorial\n\n\n* [《ngx_postgres》](https://github.com/FRiCKLE/ngx_postgres)\n\n介绍:nginx访问Postgresql模块\n\n* [《How PostgreSQL Processes a Query》](http://anoncvs.postgresql.org/cvsweb.cgi/~checkout~/pgsql/src/tools/backend/index.html)\n\n介绍:pg是如何处理一个查询的？\n\n* [《Common misconceptions about locking in PostgreSQL》](https://www.compose.io/articles/common-misconceptions-about-locking-in-postgresql/)\n\n介绍:pg中容易误解的锁\n\n* [《PostgreSQL Big SQL commponent》](http://www.bigsql.org/se/components.jsp)\n\n介绍:pg大数据工具箱\n\n* [《PostgreSQL 9.3.4 文档》](http://www.postgres.cn/docs/9.3.4/)\n\n介绍:PostgreSQL 9.3.4 文档翻译,作者是《postgresql内核分析》作者\n\n* [《pglogical：A logical replication system for PostgreSQL》](http://2ndquadrant.com/en/resources/pglogical/)\n\n介绍:pg的逻辑复制扩展,兼顾了基于触发器复制技术的灵活性,同时又有基于日志复制技术的高效性\n\n* [《Postgres EXPLAIN Visualizer》](http://tatiyants.com/pev)\n\n介绍:Postgres的EXPLAIN查看执行计划已经非常的直观、全面，不过有人更钟情于图形化的展示，现在有了这样一个项目就是干这个的：Postgres EXPLAIN Visualizer (Pev)。\n\n* [《Custom Aggregates in PostgreSQL》](https://hashrocket.com/blog/posts/custom-aggregates-in-postgresql)\n\n介绍:在写复杂的SQL时，可能会进行复杂的运算.但是原有的聚集函数并不能满足要求。这篇文章详细介绍了自定义聚集函数\n\n* [《Performance Tuning Queries in PostgreSQL》](http://www.geekytidbits.com/performance-tuning-postgres)\n\n介绍:pg性能调优之数据查询,此外推荐[https://www.youtube.com/watch?v=svqQzYFBPIo](https://www.youtube.com/watch?v=svqQzYFBPIo)\n\n* [《Building Full Text Search For Your Application using Postgres》](http://www.adalyz.com/building-full-text-search-for-your-application-using-postgres/)\n\n介绍:使用pg为自己的应用构建全文检索\n\n* [《PostgreSQL SQL Injection Cheat Sheet》](http://www.sqlinjectionwiki.com/Categories/4/postgresql-sql-injection-cheat-sheet/)\n\n介绍:PostgreSQL SQL注入手册\n\n* [《PostgreSQL Query Optimization》](http://jinchengli.me/post/postgres-query-opt/)\n\n介绍:PostgreSQL查询优化，比较新手，但是你得有点基本的优化基础。否则会看起来很吃力\n\n* [《A Tour of PostgREST》](https://begriffs.com/posts/2016-03-20-postgrest-tour.html)\n\n介绍:PostgreSQL RESTful教程\n\n* [《PostgreSQL's explain analyze made readable》](http://explain.depesz.com/)\n\n介绍:可视化PostgreSQL执行计划,pg学习看执行计划的好资料\n\n* [《PostgreSQL HA Database Clusters through Containment》](https://wiki.postgresql.org/images/1/1e/QuanHa_PGConf_US_2016_-_Doc.pdf)\n\n介绍:pg HA数据库集群分析\n\n* [《PostgreSQL 9.6 New Features With Examples》](http://community.hpe.com/hpeb/attachments/hpeb/JapanEnterpriseTopics/198/1/PostgreSQL%209.6%20New%20Features%20en%2020160606-1.pdf)\n\n介绍:PostgreSQL9.6新特性\n\n* [《Understanding EXPLAIN》](http://www.dalibo.org/_media/understanding_explain.pdf)\n\n介绍:深入学习PostgreSQL的explain工具\n\n* [《PostgreSQL Exercises》](https://pgexercises.com/)\n\n介绍:PostgreSQL学习实验室，有练习。适合新手入门pg\n\n* [《On Uber’s Choice of Databases》](http://use-the-index-luke.com/blog/2016-07-29/on-ubers-choice-of-databases)\n\n介绍:文章诞生于Uber发表的一篇关于从pg迁移到mysql的文章，国内与国外讨论甚广.在讨论过程中诞生了很多精彩的干货，值得一读。学习数据库要深入，并存的世界才是和平.推荐[为PostgreSQL讨说法 - 浅析《UBER ENGINEERING SWITCHED FROM POSTGRES TO MYSQL》](https://yq.aliyun.com/articles/58421)\n\n* [《Advanced Postgres Performance Tips》](https://robots.thoughtbot.com/advanced-postgres-performance-tips)\n\n介绍:高级PostgreSQL性能调优\n\n* [《PostgreSQL Index Internals》](https://www.pgcon.org/2016/schedule/events/934.en.html)\n\n介绍:索引的内部原理,推荐[2016年欧洲pg大会资料](https://www.pgcon.org/2016/schedule/)涵盖ppt与视频\n\n* [《PGLiveBackup》](http://www.pglivebackup.org/)\n\n介绍:pg数据库自动全量备份脚本.\n\n* [《pg_paxos:Basic implementation of Paxos and Paxos》](https://github.com/citusdata/pg_paxos)\n\n介绍:分布式算法Paxos的pg实践，可以先通过[PPT](https://wiki.postgresql.org/images/8/8f/Marco_Slot_-_pg_paxos_2015-10-29.pdf).它实现了基本的Multi-Paxos和Paxos.\n\n* [《Database Hardware Selection Guidelines》](https://momjian.us/main/writings/pgsql/hw_selection.pdf)\n\n介绍:数据库硬件选择指南,主要是一个参考.推荐[Database Hardware Selection Guidelines ](https://www.youtube.com/watch?v=qIlYZeSuv8w)\n\n* [《pglogical:Logical Replication extension for PostgreSQL》](https://github.com/2ndQuadrant/pglogical)\n\n介绍:PostgreSQL逻辑复制扩展.\n\n* [《PostgreSQL: Introduction and Concepts》](http://www.foo.be/docs-free/aw_pgsql_book.pdf)\n\n介绍:PostgreSQL的历史书.\n\n* [《How Twitch uses PostgreSQL》](https://blog.twitch.tv/how-twitch-uses-postgresql-c34aa9e56f58)\n\n介绍:PostgreSQL在twitch的应用.\n\n* [《pg_monz:PostgreSQL monitoring template for Zabbix》](http://pg-monz.github.io/pg_monz/index-en.html)\n\n介绍:PostgreSQL的Zabbix监控模版.\n\n* [《pgclusteradmin:PostgreSQL cluster manager base on Golang》](https://github.com/chenaisheng/pgclusteradmin)\n\n介绍:一款基于go开发的Postgresql集群管理工具\n\n* [《PgHero:PostgreSQL performance monitoring tool》](https://github.com/ankane/pghero)\n\n介绍:基于Ruby开发的PostgreSQL性能监控Web平台，支持SQL查询历史记录，实时连接数监控,SQL分析,性能调优推荐,Tune是基于[pgtune](http://pgtune.leopard.in.ua/)\n\n* [《GiST for PostgreSQL》](http://www.sai.msu.su/~megera/postgres/gist/)\n\n介绍:PostgreSQL的GiST（通用搜索树）核心开发作者主页.\n\n* [《Postage - A fast replacement for PGAdmin》](https://github.com/workflowproducts/postage)\n\n介绍:PGAdmin的替代工具.里面有一个比较实用的功能就是可以逆向表成关系图\n\n* [《Postgres EXPLAIN Visualizer (pev)》](http://tatiyants.com/pev/)\n\n介绍:Postgres 执行计划可视化工具\n\n* [《PostgreSQL workings in one picture》](http://blog.postgresql-consulting.com/2017/09/postgresql-workings-in-one-picture.html)\n\n介绍:一张图了解PostgreSQL工作结构\n\n* [《Postgres Indexes Under the Hood》](https://rcoh.me/posts/postgres-indexes-under-the-hood/)\n\n介绍:Postgres索引的底层运行机制\n\n* [《Annotated Config Files for PostgreSQL》](https://github.com/jberkus/annotated.conf)\n\n介绍:PostgreSQL配置文件注释篇，详细介绍每个参数的意思，其中`postgresql.10.simple.conf`为必须修改项，`extra.10.conf`为可能要修改的项。\n\n* [《pgBackRest:Reliable PostgreSQL Backup & Restore》](https://pgbackrest.org/)\n\n介绍:pgBackRest支持并行备份和恢复，增量备份。对于大规模pg数据库备份与同步很有帮助\n\n* [《PostgreSQL Related Slides and Presentations》](https://wiki.postgresql.org/wiki/PostgreSQL_Related_Slides_and_Presentations)\n\n介绍:PostgreSQL相关演讲资料。包括一些pgconf会议PPT。\n\n* [《Awesome Postgres》](https://github.com/dhamaniasad/awesome-postgres)\n\n介绍:Awesome系列，高可用、备份、管理、打包版本、命令行、监控、扩展、优化、工具、API、以及一些比较不错的博文、例如[Debugging PostgreSQL performance, the hard way\n](https://www.justwatch.com/blog/post/debugging-postgresql-performance-the-hard-way/)\n\n* [《The Internals of PostgreSQL》](http://www.interdb.jp/pg/)\n\n介绍:一本关于PG数据库管理员运维的书，主要围绕着集群、备份、Buffer、索引、复制.\n\n* [《Understanding the power of data types: PostgreSQL's Secret Weapon》](http://postgres-data-types.pvh.ca/)\n\n介绍:了解数据类型的力量：PostgreSQL的秘密武器.\n\n* [《PostgreSQL Backend Flowchart》](https://www.postgresql.org/developer/backend/)\n\n介绍:PostgreSQL的后台执行流程图,对于阅读源码或者是想了解内部的构成可以先阅读。\n\n* [《Postgres Explain Visualizer 2 》](https://github.com/dalibo/pev2)\n\n介绍:执行计划可视化工具，导出JSON格式的执行计划数据，通过这个工具可以很方便的可视化查询计划\n"
  }
]