Comments on: Análisis Exploratorio de Datos con Pandas en Python https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/ en Español Thu, 22 Apr 2021 09:51:12 +0000 hourly 1 https://wordpress.org/?v=6.1.5 By: Na8 https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-1499 Thu, 22 Apr 2021 09:51:12 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-1499 In reply to Juan Schjaer.

Buenas, en GitHub tiene la opción de ver el archivo en formato “raw” Y luego lo guardas con tu navegador!
Saludos

]]>
By: Juan Schjaer https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-1491 Tue, 13 Apr 2021 15:24:53 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-1491 Hola Juani! bueno ya me he hecho un fanático del blog me ha servido mucho y me resulta mas fácil aprender desde aquí que de otra forma.
Antes que nada quería felicitarte y darte las gracias por el aporte a la comunidad.
Al igual que me paso anteriormente con otro data set, no se desde donde se descargan, ya que me lleva a github pero una vez allí no encuentro ningún link de descarga.
Me gustaría no molestarte con algo tan básico pero quisiera aprender bien y hacer la practica con los mismos dataset seria ideal.

Desde ya muchas gracias!
Saludos.

]]>
By: Na8 https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-1484 Wed, 07 Apr 2021 09:22:54 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-1484 In reply to LeandroT.

Hola Leandro, muchas gracias por escribir y leeré ese artículo que recomiendas! Saludos

]]>
By: LeandroT https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-1483 Wed, 07 Apr 2021 08:54:45 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-1483 Hola !antes que nada felicitaciones y mil gracias por tus posts. Un trabajazo la verdad. Aportan mucha claridad y ayuda a aprender a leer entre líneas este tipo de proyecto. En el análisis exploratorio me ha ayudado mucho estar súper pegado al usuario de negocio para validar que los datos realmente reflejan la realidad que ellos tienen en mente. Esto ayuda por un lado a asegurarte que estas considerando los datos correctos y que los entiendes (como comentas que con tener datos no es suficiente) y por otro lado consigues engagement del usuario de negocio al involucrarlo en la validación. Por último un artículo que recomiendo es el de Mashur Joshi , why son many data science project fail to deliver. Gracias !

]]>
By: Na8 https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-1113 Sat, 23 May 2020 10:31:02 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-1113 In reply to Manuel Olán Olan.

Hola Manuel, gracias por escribir. Tengo en el mapa el tema de Outliers, intentaré publicar próximamente con ejemplos.
Saludos!

]]>
By: Manuel Olán Olan https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-1016 Wed, 29 Apr 2020 22:43:53 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-1016 Me gustaría que trataras el tema de Outliers Seria muy interesante,,, yo apenas me estoy involucrando pero espero ya poder hacer algunas aplicaciones en mi trabajo

]]>
By: Damián Omar Silva https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-992 Wed, 22 Apr 2020 07:15:03 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-992 In reply to cristian.

si te fijas en el dataframe, la fila 30 corresponde a Brasil; la 233 a EE.UU. Con .drop las está eliminando, ya que las detectó como outliers.
Usando inplace=True está haciendo cambios “efectivos” en el dataframe, es decir, que a partir de esa instrucción los borra de manera definitiva. Si volvés a llamar a ese df más adelante, Brasil y EE.UU no estarán.

]]>
By: cristian https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-945 Mon, 06 Apr 2020 22:49:54 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-945 Que vainaaaa…
Que hace esta linea
df_espanol.drop([30,233], inplace=True)

de donde sale el 30 y el 233

]]>
By: Jhon https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-934 Sun, 29 Mar 2020 15:23:18 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-934 Hola,
Primero que nada FELICITACIONES!!!!
Esta pagina esta de maravilla, me ha encantado y la recomendare a todo el mundo…

Solo que me queda una duda, que espero me puedas aclarar…

Por lo que leí, entendí que mientras mas alta sea la correlación (positiva o negativa) mayor relación tienen los datos.
Entonces:
¿Por que se recomienda eliminar las features con ALTA correlación?

¿O sea de que me servirá dejar los datos que no tienen relación entre ellos?

Saludos y gracias!

]]>
By: josue https://www.aprendemachinelearning.com/analisis-exploratorio-de-datos-pandas-python/#comment-822 Fri, 14 Feb 2020 04:22:29 +0000 https://www.aprendemachinelearning.com/?p=7074#comment-822 Tengo duda sobre esta linea de codigo, para que sirve o que hace
df_espanol = df.replace(np.nan, », regex=True)

y sobre el funcionamiento de set_index()

]]>