Valu Searchin myötä Valusta on vähitellen kasvanut WP-talon lisäksi myös hakukonetalo. Sen lisäksi, että pystymme Valu Searchin avulla tarjoamaan asiakkaillemme ja kumppaneidemme asiakkaille edistyneitä hakuratkaisuja, samasta tuotekehityksestä on ollut hyötyä myös WordPress-projekteihin ja erityisesti sisältösiirtoihin.
Pystymme keräämään tietoa mistä tahansa järjestelmästä sivuston julkisen käyttöliittymän kautta ja tuomaan kerralla jopa tuhansia artikkeleita ja niiden liitteitä WordPressiin. Olemme toteuttaneet laajoja sisältösiirtoja WordPressin lisäksi esimerkiksi Drupalista, Liferaysta ja Sharepointista hyödyntäen hakupalveluiden toteuttamisesta saatuja oppeja sisällön tehokkaasta keräämisestä.
Käsin siirrettäessä yhden artikkelin siirtoaika kohoaa helposti 10-15 minuuttiin, koska tekstin lisäksi liitteet ja kuvat tulee kopioida uuden järjestelmän mediakirjastoon, linkittää uudelleen ja lisätä sisällölle tarvittavat luokitukset. Itse siirtotyön lisäksi sivujen ja liitteiden aikaisemmat ja uudet url-osoitteet pitää ottaa käsin talteen uudelleenohjausten mahdollistamiseksi. Kun tuon siirtoajan kertoo esimerkiksi 2000:lla, automaattinen siirto on helposti perusteltu investointi.
Siirto käyttöliittymän kautta säästää aikaa ja kustannuksia
Verrattuna tietokannan kautta tehtävään siirtoon, asiakkaan kannalta tietojen siirto sivuston käyttöliittymän kautta säästää aikaa ja kustannuksia, koska siirto voidaan toteuttaa suoraan uuden sivustokumppanin kanssa, mikä sujuvoittaa prosessia huomattavasti.
Mikäli siirrossa avustamisesta ei ole sovittu edellisen toimittajan kanssa tehdyssä sopimuksessa, aikaisemmalla toimittajalla voi olla hyvinkin vapaat kädet hinnoitella siirrossa avustaminen omalta osaltaan. Toinen etu on se, että siirron toteuttavalla teknisellä kumppanilla ei tarvitse olla erityisosaamista lähdealustasta, mikä helpottaa työtä entisestään.
Toinen etu on se, että siirron toteuttavalla teknisellä kumppanilla ei tarvitse olla erityisosaamista lähdealustasta, mikä helpottaa työtä entisestään.
Itse tietojen keräämisen hoitavan hakurobotin lisäksi olemme kehittäneet useita aikaa ja työtä säästäviä ominaisuuksia WP CLI -pohjaiseen tuontityökaluumme. Tuontityökalu käsittelee hakurobotin tuottaman JSON-tiedoston ja asettaa sivulle tai artikkelille otsikon, sisältötekstin, julkaisuajan, luokittelut ja tarvittaessa esimerkiksi kirjoittajatiedon ja artikkelikuvan. Tuotavat kentät määräytyvät sisällön tyypin mukaan, esimerkiksi yhteystietojen siirrossa rakenteisia kenttiä on huomattavasti enemmän.
Tietoja tuotaessa jokaista tuotavaa sisältöä tai liitettä kohden tallennetaan uuteen järjestelmään sen vanha url-osoite, jonka perusteella voidaan tehdä sisältöjen uudelleenohjaukset automaattisesti tai kohdentaa myöhemmin artikkeliin liittyviä lisätietoja.
Koska uusi ja vanha osoite ovat selvillä, pelkän uudelleenohjauksen sijaan siirrettyjen sisältöjen väliset linkitykset voidaan päivittää käyttämään suoraan uutta url-osoitetta.
Url-osoitteet on kuitenkin korvattava pituusjärjestyksessä pisimmästä lyhyempään, jotta osittaiskorvaukset eivät vahingossa riko muita linkkejä. Tähän eivät esimerkiksi WP All Importin kaltaiset lisäosat pysty.
Liitetiedostojen siirtoon on panostettu
Siirrettyjen sisältöjen sisältämät kuva-, video- ja liitetiedostot tunnistetaan, ladataan WordPressin mediakirjastoon ja linkitetään artikkeliin, jossa ne esiintyvät. Tuontityökalu osaa käsitellä yleisimmät kuva- ja videomuodot, Office-tiedostot, PDF-dokumentit ja audiotiedostot. Myös liitteille tallennetaan niiden aikaisempi osoite automaattisten uudelleenohjausten mahdollistamiseksi. Tuontityökalussa on sisäänrakennettu tuplasisältöjen tunnistus, joten samaa liitettä ei ladata yhden tuonnin aikana kahteen kertaan.
Tuonnin yhteydessä sisällönsyöttäjän työtä voidaan helpottaa lisäämällä esimerkiksi ensimmäinen kuva tai aikaisempi pääkuva artikkelikuvaksi. Toisin kuin valmiisiin lisäosiin perustuvissa siirtoratkaisuissa, kuvien lataaminen onnistuu myös latausproxy:n takaa, jolloin esimerkiksi tiedostonimi poimitaan vasta varsinaisen tiedoston header-tiedoista. Monissa enterprise-järjestelmissä kuviin ja liitteisiin ei linkitetä suoraan, vaan ne sijaitsevat /?download=h40jn3q9393ua303ua -tyyppisissä osoitteissa.
Myös nostojen siirtäminen on tietyin ehdoin mahdollista
Tapauksesta riippuen myös nostoja voidaan siirtää automatiikalla. Mikäli sivulla on esimerkiksi yhteystietonosto, se voidaan korvata esimerkiksi lyhytkoodilla, jossa on mukana yhteystiedon aikaisempi url-osoite, esimerkiksi [contact url=”https://www.valu.fi/ihmiset/mikko-virenius”]. Kun myös yhteystiedot siirretään automatiikalla, vanhan osoitteen perusteella voidaan päätellä uudesta järjestelmästä oikea yhteystietokortti. Sama pätee myös muihin nostoihin, jos jokin yhdistävä tekijä on pääteltävissä.
Sisällöt saadaan siistittyä lukukelpoiseksi
Tietojen keräysvaiheeessa mukaan otetaan vain uuden sivuston kannalta olennaiset tiedot, mutta lähdejärjestelmästä riippuen sisältöalue voi sisältää toistuvia elementtejä, kuten jakopainike-koodin tai luokitteluita. Jos näitä tietoja ei voida jättää pois keräysvaiheessa ja kerätä omiin kenttiinsä, toistuvia elementtejä voidaan karsia pois julkaisujärjestelmässä tehtävällä jälkikäsittelyllä.
Useimmissa tapauksissa siirrettävät sisällöt saadaan siistittyä siten, että sisällöt ovat lukukelpoisia ilman sisällöntuottajan läpikäyntiä. Toistuvien elementtien poistamisen lisäksi lähdekoodista voidaan poistaa uuden järjestelmän kannalta merkityksetöntä merkkausta, joka voi olla peräisin joko aikaisemmasta järjestelmästä tai Word/PDF-tiedostosta kopioidusta sisällöstä.