logo

Splits en parseer een string in Python

In Python, werken met strings is een fundamenteel aspect van programmeren. Snaren zijn reeksen karakters en bevatten vaak gestructureerde gegevens die moeten worden verwerkt of geanalyseerd. De gebruikelijke bewerkingen die op tekenreeksen worden uitgevoerd, zijn splitsen en parseren.

Een string splitsen in Python

In Python kun je een string in kleinere delen splitsen met behulp van de split()> methode en De split()> methode neemt een scheidingsteken als argument en breekt de tekenreeks af bij elke keer dat het scheidingsteken voorkomt, wat een lijst met subtekenreeksen oplevert.

Syntaxis:



string.split(scheidingsteken)

Parameters:

  • delimiter> : Het teken of de subtekenreeks waarop de tekenreeks wordt gesplitst. Het is een optionele parameter.

Winstwaarde:

De split()> methode retourneert een lijst met subtekenreeksen die zijn verkregen door de originele tekenreeks te verbreken bij het voorkomen van een scheidingsteken.

str.split() Methode

Deze methode splitst een tekenreeks op in een lijst met subtekenreeksen op basis van een opgegeven scheidingsteken. De snaar Hallo, welkom bij techcodeview.com gebruik de komma (‘,’) als scheidingsteken. De split()-functie scheidt de tekenreeks in een lijst met subtekenreeksen met behulp van een scheidingsteken, wat resulteert in lijst A met [Hallo welkom bij techcodeview.com].

Voorbeeld :

Python




# Define a string containing> string>=> 'Hello,Welcome,to,techcodeview.com'> # Use the split() method to split the string into> A>=> string.split(>','>)> # Print the resulting list> print>(A)>

>

>

Uitgang:

['Hello', 'Welcome', 'to', 'techcodeview.com']>

str.rsplit() Methode

Dit is vergelijkbaar met str.split() , maar het splitst zich vanaf de rechterkant van de string. De gegeven code gebruikt de functie rsplit() om de string S in twee delen te splitsen op basis van de laatste keer dat de komma voorkomt (‘,’). Het resultaat is een lijst met de onderdelen vóór en na de splitsing. Een zal zijn [‘Hallo wereld’, ‘Python’] waar het laatste door komma's gescheiden gedeelte Python is de gescheiden van de rest van de string Hallo wereld .

Voorbeeld :

Python




# Given string> S>=> 'Hello,to,World,Python'> A>=> S.rsplit(>','>,>1>)> # Printing the result> print>(A)>

java lang naar int

>

>

Uitgang:

['Hello,to,World', 'Python']>

str.splitlines() Methode

Deze methode splitst een string op bij regeleinden en retourneert een lijst met regels. De code definieert een tekenreeks M waarbij de drie regels tekst worden gescheiden door nieuweregeltekens. Er wordt dan gebruik gemaakt van de splitlines() methode om de string op te splitsen in een lijst genaamd line en waarbij elk element een lijn uit de originele string vertegenwoordigt. Ten slotte drukt de code de inhoud van de regellijst af.

Voorbeeld :

Python




plsql

# Define a string with three lines of> # text separated by newline characters> M>=> 'GFG 1 GFG 2 GFG 3'> # Use the splitlines() method to split> line>=> M.splitlines()> print>(line)>

>

>

Uitgang:

['GFG 1', 'GFG 2', 'GFG 3']>

str.partition() Methode

Deze methode splitst een string in drie delen, gebaseerd op de eerste keer dat een separator voorkomt. De code maakt gebruik van de partitie() methode om de tekenreeks Tekst te splitsen bij de eerste keer dat het scheidingsteken voorkomt. Het wijst het deel vóór het scheidingsteken toe aan de variabele ervoor, het scheidingsteken zelf aan de variabele sep en het deel na het scheidingsteken aan de variabele erna.

Voorbeeld :

Python




# Input string> Text>=> 'Mango,Orange,apple'> before, sep, after>=> Text.partition(>','>)> # Printing the part of the string before the separator> print>(before)> print>(after)>

>

>

Uitgang:

Mango Orange,apple>

re.split() Methode

De re-module biedt krachtigere tekenreekssplitsing met behulp van reguliere expressies. De code maakt gebruik van de re.split() functie van re-module in Python om de tekstreeks te splitsen op basis van de aanwezigheid van cijfers. Het creëert een lijst P waarin elementen substrings van de tekst zijn, gescheiden door cijfers. De uitvoer zou ['Mango, Orange', 'Banana'] zijn, wat aangeeft dat de string is gesplitst op cijfer '1'.

Voorbeeld :

Python




import> re> # Input text containing a mix of> # alphabetic characters and digits> Text>=> 'Mango,Orange1Banana'> P>=> re.split(r>'d'>, Text)> # Printing the resulting list of substrings> print>(P)>

datum opmaken naar string

>

>

Uitgang:

['Mango,Orange', 'Banana']>

Lijstbegrip gebruiken

Je kunt gebruiken lijst begrip om een ​​string te splitsen en lege strings eruit te filteren. De code splitst de tekenreeks Tekst op door komma's met behulp van de split(',') en gebruikt vervolgens een lijstbegrip om een ​​lijst P te maken met de niet-lege delen na het verwijderen van eventuele voorafgaande of volgende witruimte. De uitvoer is de lijst P die bevat [‘Mango’, ‘Sinaasappel’, ‘Banaan’]. Deze code verwijdert effectief lege delen uit het gesplitste resultaat en verwijdert eventuele extra spaties.

Voorbeeld :

Python




# Given input string> Text>=> 'Mango,Orange,Banana'> # Split the input string by commas and filter out empty parts using list comprehension> P>=> [part>for> part>in> Text.split(>','>)>if> part.strip()]> # print> print>(P)>

>

>

Uitgang:

['Mango', 'Orange', 'Banana']>

In Python Het parseren van een string verwijst naar het extraheren van betekenisvolle informatie uit de gegeven string. Dit proces omvat het converteren van de string naar het gewenste gegevenstype of het extraheren van specifieke datapatronen uit de string.

Converteren naar geheel getal of zwevend

Als de string numerieke gegevens bevat. je kunt het parseren naar een gegevenstype geheel getal of zwevend met behulp van deint()>Enfloat()>functies respectievelijk. De gegeven code converteert een string 52 naar een geheel getal en drukt het resultaat (52) af. Op dezelfde manier converteert het de string 4.17 naar een getal met drijvende komma en wordt het resultaat (4.17) afgedrukt. Dit demonstreert het gebruik van de functies int() en float() om tekenreeksen naar de overeenkomstige numerieke gegevenstypen in Python te converteren.

Python




# Convert a string to an integer> number_str>=> '52'> number_int>=> int>(number_str)> print>(number_int)> # Convert a string to a floating-point number> decimal_str>=> '4.17'> decimal_float>=> float>(decimal_str)> print>(decimal_float)>

>

>

Uitgang:

52 4.17>

Conclusie

Door de hierboven genoemde methoden te gebruiken, kunt u een string splitsen en parseren. We zullen ook onderzoeken hoe we een geheel getal naar float kunnen converteren en door de split()-methode te gebruiken hoe we een snaar in kleinere delen kunnen breken gebaseerd op een scheidingsteken.