R vs. Python para el análisis de datos en proyectos de Big Data

Cuando abrimos este blog, dedicamos una entrada a comparar diferentes herramientas analíticas. En su día, hablamos de SAS, R y Python, mostrando la experiencia que tenía en el manejo de las tres de nuestro profesor Pedro Gómez. Desde entonces, han aparecido varias noticias y reflexiones comparando especialmente dos de ellas: R y Python. DataCamp publicó hace unos meses la infografía que ponemos al final de este artículo comparando ambas.

El análisis de datos, obviamente, es una parte nuclear de cualquier proyecto de Big Data. El análisis de los diferentes flujos de datos y su combinación para obtener nuevos patrones, tendencias, estructuras, etc. se puede realizar con diferentes herramientas y lenguajes de programación. La elección de estas últimas es una cuestión en muchas ocasiones de gustos, de preferencias, pero también en otras ocasiones, objeto de detallados análisis.

La infografía que hoy nos acompaña agrega múltiples fuentes que comparan R y Python. Por eso mismo, nos ha resultado interesante para compartir con vosotros. Compara ambos lenguajes desde una perspectiva de la Ciencia de Datos, o Data Science, disciplina que ya describimos en una entrada anterior.  Las debilidades y fortalezas que se muestran, así como sus ventajas y desventajas, puede ayudaros a la hora de seleccionar el mejor lenguaje de programación para vuestro problema dado. Y es que, como solemos decir, cada proyecto, cada problema, cada contexto de empresa, es diferente, por lo que dar sugerencias absolutas suele resultar complicado.

Dado que suele ser un factor bastante determinante, de entre las múltiples características para la toma de decisión, cabe destacar que ambos lenguajes gozan de una amplia comunidad de desarrollo. En este sentido, ninguna diferencia. Quizás lo que mejor caracteriza a cada uno de los lenguajes, es la frase que destacan los que elaboraran la infografía:

Python is often praised for being a general-purpose language with an easy-to-understand syntax and R’s functionality is developed with statisticians in mind, thereby giving it field-specific advantages such as great features for data visualization”

Os dejamos con la infografía para que podáis por vuestra seguir conociendo mejor cada uno de los dos: R vs. Python o Python vs. R. Seguiremos de cerca la evolución de ambos.

7 comentarios sobre “R vs. Python para el análisis de datos en proyectos de Big Data”

  1. ¡Me encanta esta comparativa! Comparto con vosotros que cada proyecto/problema/contexto es diferente, y en cada caso puede ajustarse más un lenguaje u otro.
    Personalmente me inclino algo más por la parte de la infografía que dice «I’d rather do math in a general-purpose language than try to do general-purpose programming in a math language.» Sin embargo en ciertos aspectos es preferible R, así que lo mejor es manejar ambos y tener soltura en el uso de las documentaciones, stackoverflow, etc.
    Que continúe la «batalla» y nos sigamos beneficiando de ella 🙂

    1. Totalmente de acuerdo, Arkaitz.

      Estaría bien que nos leyera también Sergio Martínez, del G1 de esta edición, que creo tiene una opinión parecida a la tuya 😉 Y estaría, genial, de paso, que os conicieráis, porque creo que vais a llevaros genial con los datos por medio 😉

      Eskerrik asko, y hasta pronto.

      1. Sin haber leído tu respuesta hasta hoy, justo ayer contactamos Sergio y yo por Linkedin!! Precisamente le envié la solicitud porque observé cierta similitud entre nuestros perfiles en esta temática 🙂

        Charlaremos cuando coincidamos en alguna sesión. Gracias por la recomendación Álex, ¡totalmente acertada!

  2. Interesante comparativa entre estos dos lenguajes de programación, ¡sobretodo la infografía!.

    Bajo mi punto de vista como programador informático, Python es una buena elección porque, aunque es un lenguaje de propósito general y funcione muy bien para el tratamiento de datos, puedes utilizar el mismo lenguaje para otras opciones, como crear una página web con Django.

  3. ¡Muy interesante! Aunque tenía más o menos una opinión ya formada, esta infografía me ha servido para conocer un poco mejor las potencialidades de R. Aunque creo que por el momento Python seguirá siendo mi arma principal, no hay que descartar R, está claro.

    Un saludo.

  4. Esta infografía está bastante anticuada. Hoy en día con R puedes desarrollar websites con los paquetes RShiny y R Markdown. Este ultimo puede trabajar con el interprete de Python que tengas en tu ordenador y por tanto puedes combinar trozos de código en R y Python muy fácilmente, importar librerías como Panda y otras,. Mi opinión es no elegir entre uno y otro, sino combinar ambos.

    Saludos,

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.