{"componentChunkName":"component---src-templates-blog-post-js","path":"/24-06-2020/","result":{"data":{"site":{"siteMetadata":{"title":"Sandra Rairán"}},"markdownRemark":{"id":"d19d1e4d-b11b-5f0c-bc7f-c990905a531a","excerpt":"Leer un Csv - Pandas DFCOVID = pd.readcsv(‘./CasospositivosdeCOVID-19en_Colombia.csv’,encoding=‘utf-8’) Leer un Csv - R COVID19<- read.csv…","html":"<h3>Leer un Csv - Pandas</h3>\n<p>DF<em>COVID = pd.read</em>csv(‘./Casos<em>positivos</em>de<em>COVID-19</em>en_Colombia.csv’,encoding=‘utf-8’)</p>\n<h3>Leer un Csv - R</h3>\n<p>COVID19&#x3C;- read.csv(“Casos<em>positivos</em>de<em>COVID-19</em>en_Colombia.csv”)</p>\n<h3>Tipo de dato - Pandas</h3>\n<p>type(DF_COVID)</p>\n<h3>Cuantas lineas y columnas tiene nuestro dataframe - Pandas</h3>\n<p>DF_COVID.shape</p>\n<h3>Cuantas lineas y columnas tiene nuestro dataframe - R</h3>\n<p>dim(COVID19)</p>\n<h3>Tipo de dato - Pandas</h3>\n<p>type(DF_COVID)</p>\n<h3>Tipo de dato - R</h3>\n<p>class(COVID19)</p>\n<h3>Visualizemos las columnas - Pandas</h3>\n<p>DF_COVID.columns</p>\n<h3>Visualizemos las columnas - R</h3>\n<p>colnames(COVID19_)</p>\n<h3>Convertir a Minúsculas - Pandas</h3>\n<p>df.column_name.str.lower()</p>\n<p>df[‘column_name’].str.lower()\nDF_COVID[‘Ciudad de ubicación’].str.lower()</p>\n<h3>Convertir a Minúsculas - R</h3>\n<p>COVID19$Ciudad.de.ubicación &#x3C;- tolower(COVID19$Ciudad.de.ubicación)</p>\n<h3>Reemplazar un cadena por otra - Pandas</h3>\n<p>DF_COVID[‘fecha reporte web’].replace(“T00:00:00.000”, \"\", regex=True)   </p>\n<h3>Reemplazar un cadena por otra - R</h3>\n<p>COVID19$Fecha.diagnostico  &#x3C;-gsub(“T00:00:00.000”, \"\",  COVID19$Fecha.diagnostico)</p>\n<h3>Convertir Date - Pandas</h3>\n<p>DF<em>COVID[‘fecha reporte web’] = pd.to</em>datetime(DF_COVID[‘fecha reporte web’])</p>\n<h3>Convertir Date - R</h3>\n<p> COVID19<em>Colombia$fecha.reporte.web &#x3C;- as.Date(COVID19</em>Colombia$fecha.reporte.web)</p>\n<h3>Colocar nombre a las columnas - Pandas</h3>\n<p>municipioscolombia.columns = [‘Codigo’, ‘Nombre’, ‘Codigo<em>departamento’, ‘Nombre</em>departamento’, ‘Latitud’, ‘Longitud’]</p>\n<h3>Colocar nombre a las columnas - R</h3>\n<p>municipioscolombia = read.table(“municipioscolombia.csv”, header=T, sep=”,” , dec=”.”)\nnames (municipioscolombia)</p>\n<p>names (municipioscolombia) = c(“Codigo”, “Nombre”, “Codigo<em>departamento”, “Nombre</em>departamento”, “Latitud”, “Longitud” )\nnames (municipioscolombia)</p>\n<h3>Creando una nueva  fila en DF - Pandas</h3>\n<p>municipioscolombia.loc[“1102”] = [47980,“Zona Bananera”,47,“Magdalena”,“10.849993”,-74.060849 ]</p>\n<h3>Creando una nueva  fila en DF - R</h3>\n<p>zb&#x3C;-data.frame(Codigo=c(47980),\nNombre=c(“Zona Bananera”),\nCodigo<em>departamento=c(47),\nNombre</em>departamento=c(“Magdalena”),\nLatitud=c(“10.849993”),\nLongitud=c(-74.060849)) # Creando un DF con las nuevas oservaciones de Zona Bananera</p>\n<p>municipioscolombia&#x3C;-rbind(municipioscolombia,zb)   # Uniendo los nuevos dataframe.</p>\n<h3>Unir dos DdataFrames - Pandas</h3>\n<p>pd.concat([DF_COVID,municipioscolombia], axis=1)</p>\n<p>Ó</p>\n<p>COVID19 = pd.merge(DF<em>COVID,municipioscolombia, left</em>on=“Código DIVIPOLA”, right_on=“Codigo”)</p>\n<h3>Unir dos DdataFrames - R</h3>\n<p>COVID19<em>Colombia &#x3C;-  merge(COVID19</em>Colombia, municipioscolombia, by.x=“Codigo”, by.y=“Codigo”, all.x=TRUE)</p>\n<h3>Eliminar columnas - Pandas</h3>\n<p>COVID19 = COVID19.drop([‘Codigo’, ‘Nombre’,‘Codigo<em>departamento’,‘Nombre</em>departamento’], axis=1)</p>\n<h3>Eliminar columnas - R</h3>\n<p>COVID19<em>Colombia &#x3C;- select(COVID19</em>Colombia, -c(Nombre,Codigo<em>departamento, Nombre</em>departamento ))</p>\n<h3>Agrupar y summarise - Pandas</h3>\n<p>COVID19[‘COUNTER’] =1       #initially, set that counter to 1.\nby<em>ubic</em>aten = COVID19.groupby([‘Ciudad de ubicación’,‘atención’])[‘COUNTER’].sum() #sum function\nprint(by<em>ubic</em>aten)</p>\n<p>Ó</p>\n<p>(COVID19.groupby([‘Ciudad de ubicación’, ‘atención’]).size()\n.sort<em>values(ascending=False)\n.reset</em>index(name=‘count’)\n.drop_duplicates(subset=‘atención’))</p>\n<h3>Agrupar y summarise - R</h3>\n<p>by<em>ubic</em>aten &#x3C;- COVID19<em>Colombia %>% group</em>by(COVID19<em>Colombia$Ciudad.de.ubicación, COVID19</em>Colombia$atención )\nby<em>atencion &#x3C;- by</em>ubic<em>aten  %>% summarise(n = n())\nby</em>atencion</p>\n<h3>filter - Pandas</h3>\n<p>COVID19.query(‘COUNTER == 1 &#x26; atención ==“Casa”‘)</p>\n<h3>filter - R</h3>\n<p>by<em>quindio &#x3C;- filter(COVID19</em>Colombia, COVID19_Colombia$Departamento.o.Distrito == “Quindío” )</p>\n<h3>Pivot - Pandas</h3>\n<p>Aten.pivot<em>table(index=‘Ciudad de ubicación’, columns=‘atención’, values=‘count’, fill</em>value=0)</p>\n<h3>Pivot - R</h3>\n<p>pivot<em>wider(names</em>from = “COVID19<em>Colombia$atención”, values</em>from = “n”, values_fill = list(n = 0)) </p>","frontmatter":{"title":"Manipulación de Datos con Pandas y R","date":"June 24, 2020","description":"Manipulación Datos con Pandas python y R"}}},"pageContext":{"slug":"/24-06-2020/","previous":{"fields":{"slug":"/11-06-2020/"},"frontmatter":{"title":"Introducción Time Series R con ggplot2"}},"next":{"fields":{"slug":"/25-06-2020/"},"frontmatter":{"title":"Computer Vision"}}}},"staticQueryHashes":["2841359383","3257411868"]}