Datavisualisatie is de techniek die wordt gebruikt om inzichten in gegevens te verkrijgen met behulp van visuele aanwijzingen zoals grafieken, diagrammen, kaarten en vele andere. Dit is nuttig omdat het helpt bij het intuïtief en gemakkelijk begrijpen van de grote hoeveelheden gegevens en daardoor betere beslissingen hierover kunt nemen. Wanneer we een groot aantal van een dataset afdrukken, wordt deze afgekapt. In dit artikel gaan we zien hoe je het geheel kunt afdrukken Panda's-dataframe of Serie zonder afkapping.
Druk een volledig Pandas DataFrame af in Python
Standaard wordt het volledige dataframe niet afgedrukt als de lengte de standaardlengte overschrijdt; de uitvoer wordt afgekapt zoals hieronder weergegeven:
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> # Loading irirs dataset> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> display(df)> |
>
>
Uitgang:
Er zijn 4 methoden om het volledige panda's-dataframe af te drukken:
- Gebruik de to_string()-methode
- Gebruik de pd.option_context()-methode
- Gebruik de pd.set_options()-methode
- Gebruik de pd.to_markdown()-methode
Methode 1: to_string() gebruiken
Hoewel deze methode de eenvoudigste van allemaal is, is deze niet aan te raden voor zeer grote datasets (in de orde van miljoenen), omdat deze het volledige dataframe omzet in een stringobject, maar zeer goed werkt voor dataframes met een grootte in de orde van duizenden.
Syntaxis: DataFrame.to_string(buf=Geen, columns=Geen, col_space=Geen, header=True, index=True, na_rep='NaN', formatters=Geen, float_format=Geen, index_names=True, justify=Geen, max_rows=Geen, max_cols=Geen, show_dimensions=False, decimaal='.', line_width=Geen)
Voorbeeld: In dit voorbeeld gebruiken we deload_iris>functie van scikit-learn om de Iris-gegevensset te laden en maakt vervolgens een pandas DataFrame (df>) met de datasetfuncties, en converteert ten slotte het volledige DataFrame naar een tekenreeksrepresentatie met behulp van to_string()> en geeft deze weer.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Convert the whole dataframe as a string and display> display(df.to_string())> |
bellford-algoritme
>
>
Uitgang:
Methode 2: pd.option_context() gebruiken
Panda's maken het mogelijk om instellingen te wijzigen via de optie_context() methode en set_option() methoden. Beide methoden zijn identiek met één verschil: later verandert men de instellingen permanent en de eerste doet dit alleen binnen het bereik van de contextmanager.
Syntaxis: pandas.option_context(*args)
Voorbeeld: In dit voorbeeld gebruiken we de Iris-gegevensset van scikit-learn en maken we een pandas DataFrame (df>) met gespecificeerde opmaakopties, en drukt het DataFrame af binnen een tijdelijke context waarin weergave-instellingen, zoals maximale rijen, kolommen en precisie, alleen voor lokaal bereik worden aangepast.
Python3
css afbeeldingsgrootte wijzigen
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # The scope of these changes made to> # pandas settings are local to with statement.> with pd.option_context(>'display.max_rows'>,>None>,> >'display.max_columns'>,>None>,> >'display.precision'>,>3>,> >):> >print>(df)> |
>
>
Uitgang:
Methode 3: pd.set_option() gebruiken
Deze methode is vergelijkbaar met de methode pd.option_context() en gebruikt dezelfde parameters als besproken voor methode 2, maar in tegenstelling tot pd.option_context() is De reikwijdte en het effect gelden voor het hele script, dat wil zeggen dat alle dataframe-instellingen permanent worden gewijzigd
Gebruik om de waarde expliciet opnieuw in te stellen pd.reset_option(‘alles’) methode moet worden gebruikt om de wijzigingen ongedaan te maken.
Syntaxis: pandas.set_option(pat, waarde)
Voorbeeld: Deze code wijzigt de weergaveopties van globale panda's om alle rijen en kolommen met onbeperkte breedte en precisie weer te geven voor het gegeven DataFrame (df>). Vervolgens worden de opties teruggezet naar hun standaardwaarden en wordt het DataFrame opnieuw weergegeven, ter illustratie van het herstel van de standaardinstellingen.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Permanently changes the pandas settings> pd.set_option(>'display.max_rows'>,>None>)> pd.set_option(>'display.max_columns'>,>None>)> pd.set_option(>'display.width'>,>None>)> pd.set_option(>'display.max_colwidth'>,>->1>)> # All dataframes hereafter reflect these changes.> display(df)> print>(>'**RESET_OPTIONS**'>)> # Resets the options> pd.reset_option(>'all'>)> display(df)> |
>
>
waardevan Java-tekenreeks
Uitgang:
Methode 4: to_markdown() gebruiken
Deze methode is vergelijkbaar met de methode to_string(), omdat deze ook het dataframe naar een stringobject converteert en er ook styling en opmaak aan toevoegt.
Syntaxis: DataFrame.to_markdown(buf=Geen, mode=’wt’, index=True,, **kwargs)
Voorbeeld: Deze code gebruikt de Iris-gegevensset van scikit-learn om een pandas DataFrame (df>), en vervolgens wordt een opgemaakte Markdown-representatie van het DataFrame afgedrukt met behulp van de to_markdown()>methode .
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=>data.feature_names)> # Converts the dataframe into str object with formatting> print>(df.to_markdown())> |
>
>
Uitgang: