Overview

Dataset statistics

Number of variables8
Number of observations129
Missing cells0
Missing cells (%)0.0%
Duplicate rows19
Duplicate rows (%)14.7%
Total size in memory8.2 KiB
Average record size in memory65.0 B

Variable types

CAT6
NUM2

Reproduction

Analysis started2020-07-09 17:56:08.689655
Analysis finished2020-07-09 17:56:13.015017
Duration4.33 seconds
Versionpandas-profiling v2.8.0
Command linepandas_profiling --config_file config.yaml [YOUR_FILE.csv]
Download configurationconfig.yaml

Warnings

Dataset has 19 (14.7%) duplicate rows Duplicates

Variables

Distinct count5
Unique (%)3.9%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
Muy deficiente
70
Deficiente
33
Regular
20
Muy buena
 
3
Buena
 
3
ValueCountFrequency (%) 
Muy deficiente7054.3%
 
Deficiente3325.6%
 
Regular2015.5%
 
Muy buena32.3%
 
Buena32.3%
 

Length

Max length14
Median length14
Mean length11.56589147
Min length5
Distinct count5
Unique (%)3.9%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean4.37984496124031
Minimum1
Maximum5
Zeros0
Zeros (%)0.0%
Memory size1.0 KiB

Quantile statistics

Minimum1
5-th percentile2.4
Q14
median5
Q35
95-th percentile5
Maximum5
Range4
Interquartile range (IQR)1

Descriptive statistics

Standard deviation0.9617188263
Coefficient of variation (CV)0.2195782807
Kurtosis2.50782915
Mean4.379844961
Median Absolute Deviation (MAD)0
Skewness-1.685930831
Sum565
Variance0.9249031008
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
58062.0%
 
42821.7%
 
31410.9%
 
243.1%
 
132.3%
 
ValueCountFrequency (%) 
132.3%
 
243.1%
 
31410.9%
 
42821.7%
 
58062.0%
 
ValueCountFrequency (%) 
58062.0%
 
42821.7%
 
31410.9%
 
243.1%
 
132.3%
 
Distinct count5
Unique (%)3.9%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
Casi nunca
53
A veces
35
Nunca
25
Casi siempre
13
Sí, siempre
 
3
ValueCountFrequency (%) 
Casi nunca5341.1%
 
A veces3527.1%
 
Nunca2519.4%
 
Casi siempre1310.1%
 
Sí, siempre32.3%
 

Length

Max length12
Median length10
Mean length8.441860465
Min length5
Distinct count3
Unique (%)2.3%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
No
124
 
3
Regular
 
2
ValueCountFrequency (%) 
No12496.1%
 
32.3%
 
Regular21.6%
 

Length

Max length7
Median length2
Mean length2.07751938
Min length2
Distinct count3
Unique (%)2.3%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
No
104
Tal vez
 
16
 
9
ValueCountFrequency (%) 
No10480.6%
 
Tal vez1612.4%
 
97.0%
 

Length

Max length7
Median length2
Mean length2.620155039
Min length2
Distinct count7
Unique (%)5.4%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
De 30 a 40 minutos
34
De 20 a 30 minutos
32
De 15 a 20 minutos
21
De 40 minutos a 1 hora
20
Más de 1 hora
11
Other values (2)
11
ValueCountFrequency (%) 
De 30 a 40 minutos3426.4%
 
De 20 a 30 minutos3224.8%
 
De 15 a 20 minutos2116.3%
 
De 40 minutos a 1 hora2015.5%
 
Más de 1 hora118.5%
 
De 10 a 15 minutos75.4%
 
De 5 a 10 minutos43.1%
 

Length

Max length22
Median length18
Mean length18.1627907
Min length13
Distinct count5
Unique (%)3.9%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean4.658914728682171
Minimum1
Maximum5
Zeros0
Zeros (%)0.0%
Memory size1.0 KiB

Quantile statistics

Minimum1
5-th percentile3
Q15
median5
Q35
95-th percentile5
Maximum5
Range4
Interquartile range (IQR)0

Descriptive statistics

Standard deviation0.7654259847
Coefficient of variation (CV)0.1642927654
Kurtosis8.224999303
Mean4.658914729
Median Absolute Deviation (MAD)0
Skewness-2.727692179
Sum601
Variance0.585876938
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%) 
510178.3%
 
41713.2%
 
386.2%
 
121.6%
 
210.8%
 
ValueCountFrequency (%) 
121.6%
 
210.8%
 
386.2%
 
41713.2%
 
510178.3%
 
ValueCountFrequency (%) 
510178.3%
 
41713.2%
 
386.2%
 
210.8%
 
121.6%
 
Distinct count43
Unique (%)33.3%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
85
Al conntrario, creo que podemos cuidarnos mucho en nuestras casas y en el SIT nos contagiamos, las unidades están muy sucias, se ve que no las limpian y mucho menos las desinfectan nunca.
 
2
Gracias
 
2
En el periodo TrasCOVID urge nuevos planteamientos en movilidad urbana.
 
1
La verdad nos piden sana distancia y los camiones orugas van a reventar saludos
 
1
Other values (38)
38
ValueCountFrequency (%) 
8565.9%
 
Al conntrario, creo que podemos cuidarnos mucho en nuestras casas y en el SIT nos contagiamos, las unidades están muy sucias, se ve que no las limpian y mucho menos las desinfectan nunca.21.6%
 
Gracias21.6%
 
En el periodo TrasCOVID urge nuevos planteamientos en movilidad urbana.10.8%
 
La verdad nos piden sana distancia y los camiones orugas van a reventar saludos10.8%
 
Que deberían obligar a todos los usuarios a usar tapabocas y meter más transporte por que van demasiado llenos10.8%
 
Desafortunadamente las personas que usamos el sit somos personas que debemos seguir trabajando porque las empresas NO quieren "mantener" a los trabajadores Ya que son recursos reemplasables mientras la mayoría de los patrones pueden estar viendo todo desde la ventana de su cuarto y no desde la ventana de un transporte público, Cuando se den cuenta que las empresas NO son nada sin trabajadores entenderán.10.8%
 
Además de ir amontonados por lo deficiente del servicio, la mayoría de los usuarios no usa cubrebocas10.8%
 
Se han implementado ciertas medidas para evitar la propagación del COVID-19 en los paraderos y en las unidades, sin embargo estas medidas no son seguidas o respetadas por los empleados y/o usuarios del servicio. Además de que no se promueve el uso de los arcos sanitizantes y el gel de alcohol es de un grado menor al requerido10.8%
 
El SIT sistema infame de transporte. Hoy el servicio no es mejor que antes, hoy se le inyectan recursos públicos al negocio particular y no hay la respuesta es superada ante la contingencia. Antes el camión no tardaba más de 10 o 15 minutos en pasar y si llegabas a tiempo a tu destino, hoy tienes que andar adivinando . Ves pasar los camiones como latas de sardinas, repletos. SIT contribuye a la propagación de contagios, si es así, ya abran parques y jardines para el.sano esparcimiento familiar.10.8%
 
Other values (33)3325.6%
 

Length

Max length499
Median length0
Mean length57.48062016
Min length0

Interactions

Correlations

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.

Phik (φk)

Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.

Cramér's V (φc)

Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here.

Missing values