Lista de los 10 mejores libros y descripciones de ciencia de datos para el generalista

Lista De Los 10 Mejores Libros Y Descripciones De Ciencia De Datos Para El Generalista



La ciencia de datos es el campo de estudio que maneja grandes cantidades de datos utilizando métodos, procesos, algoritmos y sistemas científicos para encontrar patrones invisibles, obtener información significativa, tomar decisiones comerciales en empresas y también utilizarlas en instituciones no comerciales. Las instituciones no comerciales incluyen industrias de atención médica, juegos, reconocimiento de imágenes, sistemas de recomendación, logística, detección de fraude (instituciones bancarias y financieras), búsqueda en Internet, reconocimiento de voz, publicidad dirigida, planificación de rutas aéreas y realidad aumentada. La ciencia de datos es un subconjunto de la inteligencia artificial. Los datos que se utilizan para el análisis pueden provenir de muchas fuentes diferentes y se presentan en varios formatos. Algunos de los datos fuente pueden estar estandarizados; otros pueden no estar estandarizados.

Dicho de otro modo, se utilizan diferentes metodologías para recoger los datos (plural de datum). Luego, el conocimiento (conclusiones valiosas) se extrae de los datos reunidos. En el proceso, después de recopilados los datos, se investiga sobre ellos (datos) para obtener nuevos datos (resultados) a partir de los cuales se resuelven los problemas.







La ciencia de datos como disciplina (principal) existe a nivel de licenciatura y maestría en la universidad. Sin embargo, solo unas pocas universidades en el mundo ofrecen la ciencia de datos en la licenciatura o maestría. A nivel de Licenciatura, el estudiante se gradúa con un título en Ciencia de Datos. Esto es como un título de propósito general. A nivel de Maestría, el estudiante se va con un Postgrado en Ciencia de Datos, especializándose en Análisis de Datos, Ingeniería de Datos o como Científico de Datos.



Puede sorprender al lector, y posiblemente desafortunadamente, que el aprendizaje automático, el modelado, las estadísticas, la programación y las bases de datos son conocimientos previos necesarios para estudiar la ciencia de datos a nivel de licenciatura a pesar de que son cursos universitarios respetados por derecho propio, estudiados en otras disciplinas a nivel de Licenciatura o Maestría. No obstante, cuando un estudiante asiste a una universidad para estudiar Ciencias de la Información a nivel de grado, todos estos cursos se seguirán estudiando, junto o antes de los cursos apropiados, para la Ciencia de la Información.



La ciencia de datos para la licenciatura o sus especializaciones como análisis de datos, ingeniería de datos o como científico de datos aún se están desarrollando; aunque llegaron a una etapa en que se aplican en industrias después de haber sido estudiados (en la universidad). La ciencia de datos es una disciplina relativamente nueva, en general.





Recuerda que primero debes ser generalista antes de convertirte en especialista. Las distinciones entre los programas de especialistas aún no están claras. Las distinciones entre los programas generalistas y especializados aún no están claras.

Dado que la ciencia de datos es una disciplina relativamente nueva, los libros prescritos en este documento se basan en la cobertura de contenido y no en la pedagogía (qué tan bien enseña el libro). Y son para el programa de Licenciatura (generalista). Hay diferentes cursos generalistas.



La lista

Para más detalles y posible compra con tarjeta de crédito, se proporciona un hipervínculo para cada uno de los libros. Ninguno de los libros cubre todos los cursos generalistas.

Matemáticas esenciales para la ciencia de datos: cálculo, estadística, teoría de la probabilidad y álgebra lineal

Escrito por: Hadrien Jean

  • Editor: Hadrien Jean
  • Fecha de publicación: después del 30 de septiembre de 2020
  • Idioma: ‎Inglés
  • No. de Páginas: ‎más de 400

El contenido de este libro puede verse como el curso de matemáticas para Data Science. Aunque no se recomienda aprender Data Science por sí mismo, un graduado de secundaria que quiera aprender Data Science por sí mismo debe comenzar con este libro.

Contenido: Cálculo; Estadística y Probabilidad; Álgebra lineal; Escalares y Vectores; Matrices y Tensores; Tramo, Dependencia Lineal y Transformación de Espacio; Sistemas de Ecuaciones Lineales; Vectores propios y valores propios; Valor singular de descomposición.

https://www.essentialmathfordatascience.com/

Una guía de sentido común para estructuras de datos y algoritmos: mejore sus habilidades básicas de programación / 2.ª edición

Escrito por: Jay Wengrow

  • Editorial: Estantería pragmática
  • Fecha de publicación: 15 de septiembre de 2020
  • Idioma: ‎Inglés
  • Dimensiones: 7,5 x 1,25 x 9,25 pulgadas
  • Nº de Páginas: ‎508

Este libro trata sobre algoritmos y estructuras de datos que se utilizan en Data Science. Suponiendo que alguien esté aprendiendo Data Science por sí mismo después de graduarse de la escuela secundaria, entonces este es el próximo libro que debe leer después de leer el libro de matemáticas anterior. Los programas de ejemplo se proporcionan en JavaScript, Python y Ruby.

Contenido: Por qué importan las estructuras de datos; Por qué importan los algoritmos; ¡Oh si! notación O grande; Aceleración de su código con Big O; Optimización de código con y sin Big O; Optimización para Escenarios Optimistas; Big O en el código cotidiano; Búsqueda ultrarrápida con tablas hash; Creación de código elegante con pilas y colas; Recursivamente Recursivo con Recursión; Aprendiendo a escribir en recursivo; Programación dinámica; Algoritmos Recursivos de Velocidad; estructuras de datos basadas en nodos; Acelerando todas las cosas con árboles de búsqueda binarios; Manteniendo sus prioridades ordenadas con montones; Trie no duele; Conectando todo con gráficos; Lidiando con Restricciones de Espacio; Técnicas para la Optimización de Código

Ciencia de datos más inteligente: tener éxito con datos de nivel empresarial y proyectos de inteligencia artificial / 1 S t Edición

Escrito por: Neal Fishman, Cole Stryker y Grady Booch

  • Editorial: Wiley
  • Fecha de publicación: 14 de abril de 2020
  • Idioma: ‎Inglés
  • Nº de Páginas: ‎286

Contenido: Subiendo la escalera de la IA; Enmarcando la Parte I: Consideraciones para las organizaciones que usan IA; Enmarcando la Parte II: Consideraciones para trabajar con datos e IA; Una mirada retrospectiva a Analytics: más de un martillo; Una mirada hacia el futuro en Analytics: no todo puede ser un clavo; abordar las disciplinas operativas en la escala de IA; Maximizar el uso de sus datos: ser impulsado por el valor; Valoración de datos con análisis estadístico y habilitación de acceso significativo; Construyendo para el Largo Plazo; El final de un viaje: una IA para la IA.

Aprendizaje automático: una perspectiva probabilística (serie Computación adaptativa y aprendizaje automático) Edición ilustrada

Escrito por: Kevin P. Murphy

  • Editor: The MIT Press
  • Fecha de publicación: 24 de agosto de 2012
  • Idioma: ‎Inglés
  • Dimensiones: 8,25 x 1,79 x 9,27 pulgadas
  • Nº de Páginas: ‎1104

Este libro es bueno para principiantes. De nuevo, como todo el resto de libros prescritos en este documento, este libro no cubre todo lo necesario para el programa generalista que, lamentablemente, aún no está finalizado (los programas especializados tampoco están finalizados). El principiante típico aquí es un graduado de secundaria con un pase en matemáticas e informática.

Contenido: Introducción (Machine learning: ¿qué y por qué?, Aprendizaje no supervisado, Algunos conceptos básicos en machine learning); Probabilidad; Modelos generativos para datos discretos; modelos gaussianos; estadísticas bayesianas; Estadísticas de frecuentistas; regresión lineal; Regresión logística; Modelos lineales generalizados y la familia exponencial; Modelos gráficos dirigidos (redes de Bayes); Modelos mixtos y el algoritmo EM; Modelos lineales latentes; Modelos lineales dispersos; granos; procesos gaussianos; Modelos de función de base adaptativa; Markov y modelos ocultos de Markov; Modelos de espacio de estados; Modelos gráficos no dirigidos (campos aleatorios de Markov); Inferencia exacta para modelos gráficos; inferencia variacional; Más inferencia variacional; inferencia de Montecarlo; inferencia de cadena de Markov Monte Carlo (MCMC); agrupamiento; Aprendizaje de la estructura del modelo gráfico; Modelos de variables latentes para datos discretos; Aprendizaje profundo.

Ciencia de datos para empresas: lo que necesita saber sobre la minería de datos y el pensamiento analítico de datos / 1.ª edición

Escrito por: Tom Fawcett y Foster Provost

  • Editorial: O'Reilly Media
  • Fecha de publicación: 17 de septiembre de 2013
  • Idioma: ‎Inglés
  • Dimensiones: 7 x 0,9 x 9,19 pulgadas
  • Nº de Páginas: ‎413

Contenido: Pensamiento Analítico de Datos; Problemas comerciales y soluciones de ciencia de datos; Introducción al Modelado Predictivo: De la Correlación a la Segmentación Supervisada; Ajuste de un modelo a los datos; sobreajuste y su evitación; Similitud, Vecinos y Conglomerados; Decisión Pensamiento analítico I: ¿Qué es un buen modelo?; visualización del rendimiento del modelo; Evidencia y Probabilidades; Representación y Minería de Texto; Pensamiento Analítico de Decisión II: Hacia la Ingeniería Analítica; Otras tareas y técnicas de ciencia de datos; Ciencia de Datos y Estrategia de Negocios; Conclusión.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Estadísticas prácticas para científicos de datos: más de 50 conceptos esenciales usando R y Python / 2.ª edición

Escrita por: Peter Bruce, Andrew Bruce y Peter Gedeck

  • Editorial: O'Reilly Media
  • Fecha de publicación: 2 de junio de 2020
  • Idioma: ‎Inglés
  • Dimensiones: 7 x 0,9 x 9,1 pulgadas
  • Nº de Páginas: ‎368

Contenido: análisis exploratorio de datos, distribuciones de datos y muestras, experimentos estadísticos y pruebas de significancia, regresión y predicción, clasificación, aprendizaje automático estadístico, aprendizaje no supervisado.

El libro del por qué: la nueva ciencia de causa y efecto

Escrita por: Judea Pearl, Dana Mackenzie

  • Editor: Libro básico
  • Fecha de publicación: 15 de mayo de 2018
  • Idioma: ‎Inglés
  • Dimensiones: 6,3 x 1,4 x 9,4 pulgadas
  • Nº de Páginas: ‎432

Si bien muchos libros de ciencia de datos utilizan la industria empresarial pura como ilustración, este libro utiliza la industria médica y otras disciplinas como ilustración.

Contenido: Introducción: Mind over Data; La Escalera de Causalidad; De bucaneros a conejillos de indias: la génesis de la inferencia causal; De la evidencia a las causas: el reverendo Bayes se encuentra con el Sr. Holmes; Confundir y Desconfundir: O, Matar a la Variable Acechante; El debate lleno de humo: despejando el aire; ¡Paradojas en abundancia!; Más allá del ajuste: la conquista de la intervención del monte; Contrafactuales: mundos mineros que podrían haber sido; Mediación: la búsqueda de un mecanismo; Big Data, Inteligencia Artificial y las Grandes Preguntas.

Desarrolle una carrera en ciencia de datos

Escrito por: Emily Robinson y Jacqueline Nolis

  • Editorial: Manning
  • Fecha de publicación: 24 de marzo de 2020
  • Idioma: ‎Inglés
  • Dimensiones: 7,38 x 0,8 x 9,25 pulgadas
  • Nº de Páginas: ‎354

Contenido: Introducción a la ciencia de datos; Encontrar su trabajo de ciencia de datos; Instalarse en la ciencia de datos; Creciendo en su rol de Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Ciencia de datos para principiantes / 2.ª edición

Escrito por: Lillian Pierson

  • Editorial: Para Dummies
  • Fecha de publicación: 6 de marzo de 2017
  • Idioma: inglés
  • Dimensiones: 7.3 x 1 x 9 pulgadas
  • Nº de Páginas: ‎384

Este libro asume que el lector ya tiene los conocimientos previos de matemáticas y programación.

Contenido: envolviendo su cabeza alrededor de la ciencia de datos; exploración de tuberías e infraestructura de ingeniería de datos; Aplicación de conocimientos basados ​​en datos a empresas e industrias; Aprendizaje automático: aprendizaje de datos con su máquina; Matemáticas, Probabilidad y Modelado Estadístico; uso de agrupamiento para subdividir datos; Modelado con Instancias; Construcción de modelos que operan dispositivos de Internet de las cosas; Siguiendo los Principios del Diseño de Visualización de Datos; Uso de D3.js para visualización de datos; Aplicaciones basadas en web para el diseño de visualización; Exploración de las mejores prácticas en el diseño de tableros; Elaboración de mapas a partir de datos espaciales; Uso de Python para ciencia de datos; Uso de Open Source R para Data Science; Uso de SQL en ciencia de datos; Hacer ciencia de datos con Excel y Knime; Ciencia de datos en el periodismo: clavando las cinco W (y una H); Profundizando en la ciencia de datos ambientales; ciencia de datos para impulsar el crecimiento en el comercio electrónico; uso de la ciencia de datos para describir y predecir actividades delictivas; Diez recursos fenomenales para datos abiertos; Diez herramientas y aplicaciones gratuitas de ciencia de datos.

Minería de conjuntos de datos masivos / 3 rd Edición

Escrito por: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editor: Prensa de la Universidad de Cambridge
  • Fecha de publicación: 13 de febrero de 2020
  • Idioma: inglés
  • Dimensiones: 7 x 1 x 9,75 pulgadas
  • Nº de Páginas: ‎565

Este libro también asume que el lector ya tiene los conocimientos previos de matemáticas y programación.

Contenido: Minería de datos; MapReduce y la nueva pila de software; Algoritmos usando MapReduce; encontrar artículos similares; flujos de datos de minería; análisis de enlaces; conjuntos de elementos frecuentes; agrupamiento; Publicidad en la Web; Sistemas de recomendación; Minería de gráficos de redes sociales; Reducción de dimensionalidad; Aprendizaje automático a gran escala.

Conclusión

Las distinciones entre los programas de especialistas aún no están claras. Las distinciones entre los programas generalistas y especializados tampoco están claras todavía. Sin embargo, después de leer la lista de libros dada, el lector estará en condiciones de apreciar mejor los roles especiales de analista de datos, ingeniería de datos y científico de datos, y luego avanzar.