HADOOP. SOLUCIONES BIG DATA

HADOOP. SOLUCIONES BIG DATA

LUBLINSKY, BORIS / SMITH, KEVIN T. / YAKUBOVICH, ALEXEY

49,95 €
IVA incluido
No disponible
Editorial:
ANAYA MULTIMEDIA
Año de edición:
2014
Materia
Informática
ISBN:
978-84-415-3591-6
Páginas:
512
Encuadernación:
Otros
Colección:
Anaya Multimedia/Wrox

HADOOP. SOLCIONES BIG DATA. ÍNDICE DE CONTENIDOS

Introducción
A quién va dirigido este libro
Contenidos
Estructura
Convenciones
Código fuente

1. Big Data y el ecosistema Hadoop
Big Data y Hadoop
El ecosistema Hadoop
Componentes principales de Hadoop
Distribuciones Hadoop
Desarrollo de aplicaciones de uso empresarial con Hadoop
Resumen

2. Almacenar datos en Hadoop
Descargas de código para este capítulo
HDFS
HBase
Combinar HDFS yHBase para el almacenamiento de datos efectivo
Apache Avro
Administrar metadatos con HCatalog
Seleccionar una organización de datos de Hadoop adecuada
Resumen

3. Procesamiento de datos con MapReduce
Introducción a MapReduce
La primera aplicación MapReduce
Diseñar implementaciones MapReduce
Resumen

4. Personalizar la ejecución de MapReduce
Descargas de código para este capítulo
Controlar la ejecución de MapReduce con InputFormat
Leer datos con RecordReader personalizados
Organizar datos de salida con formatos personalizados
Escribir datos con RecordReader personalizado
Optimizar la ejecución de MapReduce con un combinador
Controlar la ejecución del reductor con particionadores
Utilizar código distinto de Java con Hadoop
Resumen

5. Construir aplicaciones fiables de MapReduce
Descargas de código para este capítulo
Comprobación unitaria de aplicaciones de MapReduce
Comprobación de aplicaciones locales con Eclipse
Utilizar el registro para la comprobación de Hadoop
Informes de métricas con contadores de trabajo
Programación defensiva en MapReduce
Resumen

6. Automatizar el procesamiento de datos con Oozie
Introducción a Oozie
Workflow
Coordinator de Oozie
Bundle de Oozie
Parametrización de Oozie con lenguaje de expresiones
Modelo de ejecución de trabajos de Oozie
Acceder a Oozie
SLA de Oozie
Resumen

7. Oozie
Descargas de código para este capítulo
Validar información sobre lugares utilizando probes
Diseñar validación de lugares basada en probes
Diseñar Workflows de Oozie
Implementar aplicaciones Workflow de Oozie
Implementar actividades Workflow
Implementar aplicaciones Coordinator de Oozie
Implementar aplicaciones Bundle de Oozie
Desplegar, comprobar y analizar las aplicaciones de Oozie
Utilizar la consola de Oozie para obtener información sobre aplicaciones Oozie
Resumen

8. Herramientas avanzadas de Oozie
Descargas de código para este capítulo
Construir acciones Workflow de Oozie personalizadas
Añadir ejecución dinámica a los Workflows de Oozie
Utilizar el API Java de Oozie
Utilizar uber jars con aplicaciones Oozie
Transportador para la incorporación de datos
Resumen

9. Hadoop en tiempo real
Descargas de código para este capítulo
Aplicaciones en tiempo real en el mundo real
Utilizar HBase para implementar aplicaciones en tiempo real
Utilizar sistemas de consultas especializados de tiempo real en Hadoop
Utilizar sistemas de procesamiento de eventos basados en Hadoop
Resumen

10. La seguridad en Hadoop
Historia breve: comprender los retos de seguridad en Hadoop
Autentificación
Autorización
Autentificación y autorización de Oozie
Encriptación de red
Mejoras de seguridad con Project Rhino
Recopilación. Buenas prácticas para proteger Hadoop
Resumen

11. Ejecutar aplicaciones de Hadoop en AWS
Descargas de código para este capítulo
Introducción a AWS
Opciones para ejecutar Hadoop en AWS
Comprender la relación entre EMR y Hadoop
Utilizar S3 de AWS
Automatizar la ejecución y la creación de un flujo de trabajo EMR
Organizar ejecución de trabajos en EMR
Resumen

12. Construir soluciones de seguridad empresarial para las implementaciones de Hadoop
Preocupaciones de seguridad para las aplicaciones de empresa
Elementos que la seguridad de Hadoop no proporciona de manera nativa para las aplicaciones de empresa
Enfoques para las aplicaciones de seguridad en la empresa con Hadoop
Resumen

13. El futuro de Hadoop
Simplificar la programación de MapReduce con DSL
Procesamiento más rápido y ampliable
Mejoras de seguridad
Tendencias emergentes
Resumen

Apéndice. Lecturas recomendadas
Almacenamiento y acceso de los datos de Hadoop
MapReduce
Oozie
Hadoop en tiempo real
AWS
DSL de Hadoop
Seguridad de Hadoop y Big Data

Índice alfabético

La tecnología progresa sin cesar y con ella proliferan los dispositivos conectados a la red, lo que hace que cada vez generemos y almacenemos cantidades más ingentes de datos. En este contexto se está produciendo un crecimiento espectacular en la diversidad de formatos de datos e información, también llamados Big Data.

Y es que, sencillamente, si una empresa no es capaz de manejar cantidades enormes de datos con eficacia y aprovechando esa información para mejorar, esto se traducirá en pérdida de productividad, de oportunidades y de beneficios. Existen muchas tecnologías destinadas a procesar y analizar grandes cantidades de información. Pero cuando Apache Hadoop entró en escena, todo cambió: por fin es posible escribir programas con facilidad y llevar a cabo análisis de datos a gran escala.

Este libro explica cómo trabajan juntas las numerosas partes del ecosistema Hadoop y cómo se pueden utilizar para construir soluciones adaptadas a la empresa. Aprenderá cómo realizar el diseño de datos y su impacto en la implementación, al mismo tiempo que verá cómo funciona MapReduce y cómo reformular problemas concretos. Encontrará ejemplos detallados de código Java que puede utilizar, derivados de aplicaciones que han sido construidas e implantadas con éxito.

Artículos relacionados

  • CULTURA HACKER DE LA A A LA Z
    CRAWLEY, KIM
    La cultura hacker puede ser misteriosa, pero esta entretenida guía de referencia está aquí para ayudar. Escrita por Kim Crawley, una investigadora de ciberseguridad y escritora experimentada, esta guía de referencia divertida te presenta a personas y empresas importantes, ideas fundamentales junto con películas, juegos y revistas que marcaron hitos en los anales de la piratería...
    Disponible en la librería

    34,95 €

  • INFERENCIA CAUSAL Y DESCUBRIMIENTO EN PYTHON
    MOLAK, ALEKSANDER
    En comparación con el aprendizaje automático tradicional y las estadísticas, los métodos causales presentan desafíos únicos. Aprender causalidad puede ser difícil, pero ofrece distintas ventajas que escapan a una mentalidad puramente estadística. Este libro ayuda a liberar todo el potencial de la causalidad.El libro comienza con las motivaciones básicas del pensamiento causal y...
    Disponible en la librería

    37,95 €

  • MINECRAFT OFICIAL: GUÍA PARA PRINCIPIANTES
    AB, MOJANG
    ¿ERES NUEVO EN MINECRAFT O AÚN NO LE HAS PILLADO EL TRANQUILLO? ¡Este libro es para ti! Métete en Minecraft de cabeza con esta guía para principiantes que te enseñará todo lo que necesitas saber para emprender tu viaje en Minecraft, tanto en modo Supervivencia como Creativo. ¿Quieres saber lo que pasa cuando te mueres y cómo evitarlo, cómo alimentarte y dónde encontrar las cria...
    Disponible en la librería

    19,90 €

  • CURSO DE MICROSOFT 365 Y COPILOT
    FERNANDEZ GUTIERREZ, ISABEL
    En este libro te mostraré el uso de potentes herramientas que potenciarán tu productividad en el entorno laboral, permitiéndote adaptarte rápidamente a los tiempos en que el trabajo remoto o híbrido es una opción probable.Este libro te enseñará a ubicar tus documentos en la nube para acceder a ellos desde cualquier lugar y dispositivo, comprenderás las diferencias entre OneDriv...
    Disponible en la librería

    29,95 €

  • 101 FUNCIONES CON EXCEL
    SALDÍVAR ZALDIVAR, AXEL DANIEL / ZALDIVAR NAVARRO, DANIEL / CUEVAS JIMENEZ, ERIIK VALDEMAR / PÉREZ CI
    Con este libro aprenderás a hacer magia sobre las hojas de cálculo con las 101 funciones más importantes y utilizadas. Aprenderás a realizar cálculos con el tiempo, a manejar las fechas y las horas dentro de Excel, a buscar, a reemplazar, a ordenar, a filtrar información a realizar cálculos matemáticos y estadísticos, a tomar decisiones en base a criterios lógicos, a manejar te...
    Disponible en la librería

    19,90 €

  • INTELIGENCIA ARTIFICIAL
    MITCHELL, MELANIE
    Melanie Mitchell separa la ciencia real de la ciencia ficción en este amplio examen del estado actual de la IA y de cómo está rehaciendo nuestro mundo. Ninguna empresa científica reciente ha resultado tan seductora, aterradora y llena de extravagantes promesas y frustrantes reveses como la inteligencia artificial. La galardonada autora Melanie Mitchell, una destacada científica...
    Disponible en la librería

    26,00 €