# Cicli e stringhe

*(Sezione 4.8 del libro di testo)*

L'uso dei cicli consente di affrontare tutta un serie di nuovi problemi con le stringhe. Infatti, usando un contatore, è possibile scorrere i caratteri che formano una stringa e prendere decisioni in tal senso.

Come primo esempio, consideriamo il seguente problema:
<blockquote>
Scrivere un programma che prende in input una stringa, e stampa i caratteri che la compongono una riga alla volta.
</blockquote> 

Se noi sapessimo la lunghezza prima di scrivere il programma, potremmo scrivere il programma anche senza bisogno di cicli. Basterebbe usare l'operazione di estrazione di caratteri da una stringa (le parentesi quadre). Ad esempio, questo programma funziona per stringhe di lunghezza 4.

In [2]:
s = input("Inserisci stringa di lunghezza 4: ")
print(s[0])
print(s[1])
print(s[2])
print(s[3])

c
i
a
o


La soluzione qui sopra funziona solo se la stringa s ha esattamente 4 caratteri: se ne ha solo `3`, l'accesso ad `s[3]`  genera un errore. Se ne ha di più, vengono visualizzati solo i primi 4 caratteri. 

Questo approccio è ovviamente impraticabile se la stringa è stroppo lunga, ed del tutto infattibile se non conosciamo a priori la lunghezza. Siamo nella stessa situazione di quando abbiamo affrontato il problema di stampare al somma di numeri senza usare i cicli: facile se devo sommare i numeri da 1 a 10, impraticabile per la somma dei numeri da 1 a 100, impossibile se non so in anticipo quando scrivo il programma fino a che numero devo sommare.

Ci servirà quindi usare un ciclo con un contatore che scandisce tutte le possibili posizioni di caratteri in una stringa `s`, che ricordiamo vanno da `0` a `len(s) - 1`.

In [25]:
s = input("Inserisci stringa: ")
i = 0
while i <= len(s)-1:  # o, se preferite, i < len(s)
    print(s[i])
    i += 1

c
i
a
o


Ovviamente è possibile usare il alternativa il ciclo `for`.

In [26]:
s = input("Inserisci stringa: ")
for i in range(len(s)):
    print(s[i])

c
i
a
o


Notare che questo esempio mostra che la scelta di `for ... range` di escludere l'estremo superiore dell'intervallo è particolarmente comoda quando si utilizza per scorrere gli elementi di una stringa. Infatti, poiché l'estemo superiore è escluso, con `range(len(s))` la variabile del for assumerà i valore da `0` a `len(s)-1`, che sono proprio quelli corretti per esaminare tutti i caratteri della stringa.

## Ricordare cosa è accaduto in un ciclo: esempi con le stringhe

Molti problemi affrontati nelle lezioni precedenti sugli input multipli si ritrovano anche per le stringhe. Ricorderete che nella lezione precedente abbiamo visto come:
  * contare il numero di volte che si è verificata una certa condizione;
  * determinare se una certa condizione si è verificata **in almeno una** iterazione;
  * determinare se una certa condizione si è verificata **in tutte** le iterazioni.

Applicheremo ora questi schemi al caso delle stringhe, invece che degli input ripetuti, per rispondere a questi problemi:
  * contare il numero di vocali in una stringa;
  * determinare se una stringa contiene **almeno una** vocale;
  * determinare se una i caratteri che compogono una stringa sono **tutte** vocali.

In questo caso il ciclo, invece di chiedere input all'utente, scorrerà i caratteri che formano la stringa. La condizione di cui ci interessa tenere traccia è se il carattere corrente è una vocale.

### Contare il numero di vocali

La soluzione è abbastanza semplice. Vediamo un esempio con il `while`.

In [38]:
# Potrei leggere la stringa s dalla tastiera, ormai l'abbiamo capito, ma per semplicità
# la scrivo direttamente nel programma.
s = "ciao"
vocali = 0
i = 0
while i < len(s):
    if s[i] in "aeiou":
        # in alternativa, potremmo usare la condizione s[i]="a" or s[i]="e" or s[i]="i" or s[i]="o" or s[i]="u"
        vocali += 1
    i += 1
print("Ci sono", vocali, "vocali")

Ci sono 3 vocali


Notare due cose:
  1. Ormai abbiamo capito che possiamo prendere in input dei valori da tastiera. Ma per fare degli esperimenti, soprattutto se si lavora con i notebook, è più semplice scrivere direttamente nel programma il valore sul quale vogliamo sperimentare. Da ora in poi, ogni tanto faremo così invece di usare la funzione `input`.
  2. Ricordate che `s1 in s2` è vero quando `s1` è una sottostringa di `s2`. In particolare, se `s1` è  un solo carattere come nel caso di sopra, `s1 in s2` è vero quando il carattere `s1` è compreso nella stringa `s2`.

In alternativa, si può usare il `for`.

In [29]:
s = "ciao"
vocali = 0
for i in range(len(s)):
    if s[i] in "aeiou":
        # in alternativa, potremmo usare la condizione s[i]="a" or s[i]="e" or s[i]="i" or s[i]="o" or s[i]="u"
        vocali += 1
print("Ci sono", vocali, "vocali")

Ci sono 3 vocali


### Determinare se la stringa contiene almeno una vocale

La prima soluzione che mostriamo è un semplice variante di quella di sopra: invece di usiamo una variabile per contare il numero di vocali, usiamo una variabile booelana che inizializziamo a `False` e portiamo a `True` appena troviamo una vocale. Alla fine del ciclo, stampiamo `EUREKA` se abbiamo trovato la vocale.

In [30]:
s ="ciao"
esiste_vocale = False
i = 0
while i < len(s):
    if s[i] in "aeiou":
        esiste_vocale = True
    i += 1

if esiste_vocale:
    print("EUREKA")

EUREKA


Tuttavia, rispetto all'esempio del conteggio, possiamo scrivere qualcosa di più ottimizzato: non appena troviamo una vocale, è inutile continuare a controllare i successivi caratteri della stringa. Ormai la vocale l'abbiamo trovata, niente potrà fare cambiare questa cosa. Possiamo quindi mettere un `break` per terminare subito il ciclo:

In [31]:
s="ciao"
esiste_vocale = False
i = 0
while i < len(s):
    print(i)  # non serve
    if s[i] in "aeiou":
        esiste_vocale = True
        break
    i += 1

if esiste_vocale:
    print("EUREKA")

0
1
EUREKA


Notare che abbiamo inserito una `print(i)` dentro il ciclo a scopo di verifica: ci serve per controllare che il programma esca appena incontra una vocale. Se provate il programma di sopra con la stringa `ciao`, esso stamperà
```
0
1
EUREKA
```
perché dopo aver letto la lettera in posizione 1 (la `i`), terminerà il ciclo. Se provate a togliere il break, non ci sarà nessuna terminazione anticipata del ciclo e l'output sarà
```
0
1
2
3
EUREKA
```

Ovviamente è possibile anche una soluzione col `for`:

In [32]:
s = "ciao"
esiste_vocale = False
for i in range(len(s)):
    print(i)  # non serve
    if s[i] in "aeiou":
        esiste_vocale = True
        break

if esiste_vocale:
    print("EUREKA")

0
1
EUREKA


#### Uscita anticipata dal ciclo senza break

Vogliamo adesso cercare una soluzione con uscita anticipata dal ciclo che non usi il `break` (l'istruzione break potrebbe non piacere a qualche programmatore purista). **Questo è possibile solo se usiamo il ciclo while**.

Se non vogliamo usare il `break`, dobbiamo fare in modo che si esca dal ciclo `while` in maniera *naturale* appena troviamo una vocale. Questo vuol dire che la condizione del while deve diventare falsa quando troviamo una vocale. Ci sono due modi di farlo.

Il primo modo, che a me non piace e che sicuramente non verrebbe apprezzato dal purista di cui sopra, è cambiare il contatore `i` in maniera tale da metterlo ad un valore sufficientemente grande da rendere fasa la condizione `i < len(s)`. Si tratta di una specie di *avani veloce* in cui si dice di saltare tutti gli altri caratteri ed arrivare alla fine della stringa.

In [39]:
s = "ciao"
esiste_vocale = False
i = 0
while i < len(s):
    print(i)
    if s[i] in "aeiou":
        esiste_vocale = True
        i = len(s)
    i += 1

if esiste_vocale:
    print("EUREKA")

0
1
EUREKA


Ripeto che questa cosa funziona solo con il comando `while`. Al comando `for` non interessa nulla che voi modifichiate il valore della variabile iteratore dentro il corpo del ciclo, perché non usa questo valore decidere quando uscire. Pertanto il programma che segue non effettua nessuna uscita anticipata dal ciclo quando incontra una vocale.

In [41]:
s = "ciao"
esiste_vocale = False
for i in range(len(s)):
    print(i)
    if s[i] in "aeiou":
        esiste_vocale = True
        i = len(s)

if esiste_vocale:
    print("EUREKA")

0
1
2
3
EUREKA


Un modo sicuramente più elegante è cambiare la condizione del while in `i < len(a) and esiste_vocale == False`. In questo modo, finché `esiste_vocale` è `False`, il secondo congiunto della condizione sarà `True`, cioè come se non ci fosse perché `True` è l'elemento neutro di `and`. Ma appena `esiste_vocale` viene messa a `True`, il secondo congiunto diventa `False`, e fa fallire tutta la condizione del while.

Se vi sembra più semplice `esiste_vocale == False` è equivalente a `not esiste_vocale` (in logica, diremmo questa cosa scrivendo la seguente eguaglianzan: $A \leftrightarrow \bot \equiv \neg A$). La seconda forma è di solito preferita dai programmatori Python.

In [40]:
s = "ciao"
esiste_vocale = False
i = 0
while i < len(s) and not esiste_vocale:
    print(i)
    if s[i] in "aeiou":
        esiste_vocale = True
    i += 1

if esiste_vocale:
    print("EUREKA")

0
1
EUREKA


### Determinare se la stringa è formata solo da vocali

Si tratta della variante con quantificatore universale dell'esempio di prima. Questa è la versione con ciclo abbreviato tramite `break`. 

In [37]:
s = "ciao"
sempre_vocale = True
i = 0
while i < len(s):
    print(i)
    if s[i] not in "aeiou":
        sempre_vocale = False
        break
    i += 1

if sempre_vocale:
    print("EUREKA")

0


Se l'input è `ciao`, l'output sarà:
```
0
```
Questo perché dopo aver esaminato il primo carattere, vedendo che è una consonante, capirà che la stringa non è formata da sole vocali, imposterà la variabile `sempre_vocale` a `False` e uscirà dal ciclo.

## Costruire una stringa pezzo per pezzo

Vediamo infine un ultimo esempio in cui, a differenza di quelli visti prima, costruiamo una stringa in maniera iterativa, un carattere alla volta.

### Rimuovere gli spazi (primo tentativo)

Supponiamo di voler scrivere un programma che prende in input una stringa `s` e stampa la stessa stringa senza spazi. Il programma, ad esempio, data la stringa `ciao sono io` deve stampare `ciaosonoio`. Un primo modo per realizzare questo programma è il seguente:

In [18]:
s = "ciao sono io"
# Scorro tutti i caratteri di s
for i in range(len(s)):
    # Se il carattere i-esimo non è spazio, lo stampo senza andare a capo
    if s[i] != " ":
        print(s[i], end="")

ciaosonoio

Notare che per stampare un carattere senza andare a capo, usiamo una nuova sintassi della `print`. Dopo l'elenco delle cose da stampare, mettiamo `end=""` dentro parentesi, come fosse un parametro. Per ora prendetelo per buono, più in là nel corso spiegheremo meglio il motivo di questa sintassi peculiare.

### Rimuovere gli spazi (creazione stringa risultato)

Adesso però chiediamo una cosa diversa dal programma: vogliamo che il programma non stampi un carattere alla volta, ma che prima costruica una nuova stringa contenente la stringa `s` con gli spazi rimossi, e solo alla fine stampi la nuova stringa in una volta sola. Il programma è leggermente più complesso:

In [19]:
s = "ciao sono io"
# Questa variabile conterrà il risultato, per ora la inizializziamo con una stringa vuota
news = ""
for i in range(len(s)):
    if s[i] != " ":
        news += s[i]
print(news)

ciaosonoio


Come vedete il problema non è molto più complesso di prima, ma ci si potrebbe chiedere che vantaffi può avere questa soluzione rispetto a quella di prima. Supponiamo di non voler solo togliere gli spazi, ma magari fare dopo altre trasformazioni come convertire in maiuscolo. Una volta che un carattere l'ho stampato con `print` non posso più farci nulla. Ma se invece il risultato lo metto in una variabile, come nell'esempio di prima, poi posso manipolarlo come voglio, ad esempio con il metodo `upper`, come segue:

In [21]:
s = "ciao sono io"
# Questa variabile conterrà il risultato, per ora la inizializziamo con una stringa vuota
news = ""
for i in range(len(s)):
    if s[i] != " ":
        news += s[i]
print(news.upper())

CIAOSONOIO


### Stringa al contrario

Infine, vogliamo scrivere un programma che, presa una stringa `s`, ci dia come risultato una nuova stringa `news` come quella di partenza, ma con i caratteri nell'ordine inverso. Cioè, se `s="ciao"`, la variabile `news` dovrà essere `"oiac"`. Il tutto è molto simile all'esempio di sopra, solo che:
1. non facciamo niente di speciale per gli spazi
2. quando concateniamo un carattere alla stringa `news` non lo aggiungiamo a destra ma a sinistra, in modo che alla fine l'ordine dei caratteri sia invertito. 

In [22]:
s="ciao sono io"
news=""
for i in range(len(s)):
    news = s[i] + news
print(news)

oi onos oaic


Un altro valido approccio è quelo di iterare sulle lettere che compongono la stringa `s` dall'ultima alla prima posizione, e lasciare l'operaione di concatenazione come era nel programma degli spazi.

In [1]:
s="ciao sono io"
news=""
for i in range(len(s)-1, -1, -1):
    news += s[i]
print(news)

oi onos oaic


Notare il range. Il valore di partenza è `len(s)-1`, che è l'ultima posizione della stringa. Il valore di incremento è `-1`, perché è una iterazione decrescente. La cosa strana però è il valore finale, anch'esso `-1`. L'ultimo valore che deve essere considerato per `i` è lo 0, che è la posizione del primo carattere della stringa. Ma non possiamo scrivere `range(len(s)-1,0,-1)` perché l'ultimo valore del `range` è escluso dall'iterazione. Mentre nelle iterazioni crescenti bisogna *aggiungere* 1 al valore finale, nell iterazioni decrescenti bisogna *togliere* 1, ottenendo appunto `-1`.