Consigli Semalt su come utilizzare il deep learning per ottimizzare il tag del titolo automatizzato



Un modo rapido per assumere un ruolo guida nel ranking SEO è includere una parola chiave di primo livello nel tag del titolo. E se ci pensi per un minuto, ti renderai conto che è davvero una soluzione intelligente. Se hai una pagina che si sta già classificando per una parola chiave senza che quella parola chiave sia presente nel titolo, immagina il significato di avere la parola chiave nel titolo. Naturalmente verrai indicizzato più spesso per quella parola chiave; quindi ti classifichi meglio.

Ora, se abbiamo preso quella parola chiave e l'abbiamo aggiunta alla tua meta descrizione, appariranno evidenziate nei risultati di ricerca, il che significa che è probabile che più utenti dei motori di ricerca facciano clic. Questo, ovviamente, andrà a vantaggio del sito web.

Immagina che Semalt stesse lavorando su un sito web con centinaia, migliaia o milioni di pagine. Se dovessimo farlo manualmente, richiederà molto tempo e diventerà piuttosto costoso rapidamente. Allora come possiamo analizzare la pagina e ottimizzare ogni titolo e meta descrizione? La soluzione è usare una macchina. Insegnando a una macchina a trovare le parole chiave con il posizionamento più alto in ogni pagina, risparmiamo tempo e costi. L'uso di una macchina può risultare migliore e più veloce di un team di immissione dati.

Reintroduciamo Ludwig di Uber e T5 di Google

Combinando Ludwig di Uber e T5 di Google, hai un sistema piuttosto potente.

In sintesi, Ludwig è uno strumento di machine learning automatico open source che consente ai suoi utenti di addestrare modelli avanzati senza dover scrivere alcun codice.

Google T5, d'altra parte, è una versione superiore dei modelli in stile SERT. Il T5 può riepilogare, tradurre, rispondere a domande e classificare query di ricerca, nonché molte altre funzioni. In poche parole, è un modello molto potente.

Tuttavia, non vi è alcuna indicazione che T5 sia stato addestrato per l'ottimizzazione dei tag del titolo. Ma forse possiamo farlo, ed ecco come:
  • Otteniamo un set di dati addestrato con esempi costituiti da:
    • Tag del titolo originali senza la nostra parola chiave di destinazione
    • Le nostre parole chiave target
    • Tag del titolo ottimizzati con le parole chiave di destinazione
  • Un codice di ottimizzazione T5 e tutorial da utilizzare
  • Avere una serie di titoli che non sono stati ottimizzati in modo da poter testare il nostro modello
Inizieremo con un set di dati che è già stato creato e forniremo una guida su come abbiamo creato il set di dati.

Gli autori di T5 sono stati così generosi da fornirci un dettagliato notebook Google Colab, che utilizziamo per mettere a punto T5. Dopo aver passato del tempo a studiarlo, siamo stati in grado di rispondere a domande a quiz arbitrarie. Il notebook Colab ha anche linee guida su come mettere a punto il T5 per nuove attività. Tuttavia, quando guardi le modifiche al codice e la preparazione dei dati richiesta, scopri che richiede molto lavoro e che le nostre idee potrebbero essere perfette.

Ma se fosse più semplice? Grazie alla versione 3 di Uber Ludwig, rilasciata pochi mesi fa, abbiamo una combinazione di alcune funzionalità molto utili. La versione 3.0 di Ludwig viene fornita con:
  • Un meccanismo di ottimizzazione degli iperparametri che ricava prestazioni aggiuntive dai modelli.
  • Integrazione senza codice con il repository Transformers di Hugging Face. Ciò consente agli utenti di accedere a modelli aggiornati come GPT-2, T5, DistilBERT ed Electra per attività di elaborazione del linguaggio naturale. Alcune di queste attività includono l'analisi del sentiment di classificazione, il riconoscimento di entità denominate, la risposta alle domande e altro ancora.
  • È più recente, più veloce, modulare e dispone di un back-end estensibile che si basa su TensorFlow 2.
  • Fornisce supporto per molti nuovi formati di dati come Apache Parquet, TSV e JSON.
  • Ha un'abilitazione di convalida incrociata k-fold pronta per l'uso.
  • Se integrato con Pesi e pregiudizi, può essere utilizzato per la gestione e il monitoraggio di più processi di addestramento del modello.
  • Ha un nuovo tipo di dati vettoriali che supporta etichette rumorose. Ciò è utile se abbiamo a che fare con controlli deboli.
Ci sono diverse nuove funzionalità, ma troviamo l'integrazione con Hugging Face's Transformers come una delle funzionalità più utili. L'abbraccio delle pipeline dei volti può essere utilizzato per migliorare in modo significativo gli sforzi SEO sui titoli e la generazione di meta description.

L'uso della pipeline è ottimo per eseguire previsioni su modelli già addestrati e già disponibili nel modello bub. Tuttavia, al momento non ci sono modelli in grado di fare ciò di cui abbiamo bisogno, quindi uniamo Ludwig e Pipeline per creare un formidabile titolo automatico e una meta descrizione per ogni pagina di un sito web.

Come utilizziamo Ludwig per mettere a punto T5?

Questa è una domanda importante perché cerchiamo di mostrare ai nostri clienti esattamente cosa accade in background sul loro sito web. Da queste parti, c'è un cliché che dice "usare Ludwig per l'addestramento T5 è così semplice, dovremmo considerare di renderlo illegale". La verità è che avremmo addebitato ai nostri clienti molto più alti se avessimo dovuto assumere un ingegnere di intelligenza artificiale per fare l'equivalente.

Qui scoprirai come mettere a punto T5.
  • Passaggio 1: apri un nuovo blocco appunti di Google Colab. Dopodiché, cambiamo il runtime per utilizzare la GPU.
  • Scarichiamo il set di dati di Hootsuite che è già stato creato.
  • Quindi installiamo Ludwig.
  • Dopo l'installazione, carichiamo il set di dati di addestramento in un data frame panda e lo ispezioniamo per vedere che aspetto ha.
  • Quindi affrontiamo l'ostacolo più significativo, ovvero la creazione del file di configurazione corretto.
La creazione del sistema perfetto richiede la documentazione per T5 e continui tentativi ed errori finché non lo facciamo correttamente. (sarebbe molto utile se riuscissi a trovare il codice Python da produrre qui.)

Assicurati di rivedere i dizionari delle funzionalità di input e output e assicurati che le tue impostazioni siano raccolte correttamente. Se fatto bene, Ludwig inizierà a usare 't5-small' come modello da corsa. Per i modelli T5 più grandi, è più facile cambiare il mozzo del modello e potenzialmente migliorarne la generazione.

Dopo aver addestrato un modello per diverse ore, iniziamo a ottenere una straordinaria precisione di convalida.

È importante notare che Ludwig seleziona automaticamente altre misurazioni cruciali per la generazione del testo, principalmente perplessità e modifica della distanza. Questi sono entrambi numeri bassi che si adattano perfettamente a noi.

Come utilizziamo i nostri modelli addestrati per ottimizzare i titoli

Mettere alla prova i nostri modelli è la parte davvero interessante.

Innanzitutto, scarichiamo un set di dati di prova con titoli Hootsuite non ottimizzati che non sono stati visti dal modello durante l'addestramento. Sarai in grado di visualizzare in anteprima il set di dati utilizzando questo comando:

!capo

Hootsuite_titles_to_optimize.csv

È davvero impressionante che Ludwig e T5 possano fare così tanto con qualsiasi piccolo set di addestramento e non richiedono una messa a punto avanzata di iperparametri. Il test corretto si riduce a come interagisce con le nostre parole chiave target. Quanto bene si fonde?

Creazione di un'app per l'ottimizzazione dei tag del titolo con Streamlight

Gli autori di contenuti trovano questa applicazione molto utile. Non sarebbe fantastico avere un'app semplice da usare che non richiede molte conoscenze tecniche? Bene, è proprio per questo che Streamlight è qui.

La sua installazione, così come l'uso, è abbastanza semplice. Puoi installarlo usando:

! pip install streamline

Abbiamo creato un'app che sfrutta questo modello. Quando necessario, possiamo eseguirlo dallo stesso posto in cui addestriamo un modello, oppure possiamo scaricare un modello già addestrato in cui intendiamo eseguire lo script. Abbiamo anche preparato un file CSV con i titoli e le parole chiave che speriamo di ottimizzare.

Ora lanciamo l'app. Per eseguire il modello, dobbiamo fornire il percorso del file CSV, che contiene i titoli e le parole chiave che speriamo di ottimizzare. I nomi delle colonne CSV devono corrispondere ai nomi durante l'addestramento di Ludwig. Se il modello non ottimizza tutti i titoli, niente panico; anche ottenere un numero decente è un grande passo avanti.

Come esperti in Python, siamo molto entusiasti quando lavoriamo con questo, poiché di solito ci fa pompare il sangue.

Come produrre un set di dati personalizzato da addestrare

Utilizzando i titoli di Hootsuite, possiamo addestrare modelli che funzionerebbero bene per i nostri clienti ma potrebbero essere predefiniti per i loro concorrenti. Questo è il motivo per cui ci assicuriamo di produrre il nostro set di dati, ed ecco come lo facciamo.
  • Sfruttiamo i nostri dati da Google Search Console o Bing Webmaster Tools.
  • In alternativa, possiamo anche estrarre i dati sulla concorrenza del nostro cliente da SEMrush, Moz, Ahrefs, ecc.
  • Quindi scriviamo uno script per i tag del titolo e poi dividiamo i titoli che hanno e non hanno la parola chiave di destinazione.
  • Prendiamo i titoli che sono stati ottimizzati utilizzando parole chiave e sostituiamo le parole chiave con sinonimi, oppure utilizziamo altri metodi in modo che il titolo sia "deottimizzato".

Conclusione

Semalt è qui per aiutarti a ottimizzare automaticamente i tag del titolo e le meta descrizioni. In questo modo, puoi rimanere in testa alla SERP. L'analisi di un sito web non è mai un compito facile. Ecco perché addestrare una macchina per aiutarci a fare questo non solo consente di risparmiare sui costi, ma anche di risparmiare tempo.

In Semalt, ci sono professionisti che configureranno il tuo set di dati, Ludwig e T5 in modo che tu possa continuare a vincere sempre.

Dacci una chiamata oggi.

mass gmail