Twitter algoritma definīcija

Kā čivināt datorus lasīt tweets

Definīcija:

Smart cilvēki Twitter ir izveidojuši super izsmalcinātu algoritmu, lai viņu smart datorus zina, kā "lasīt" gazillion tweets viņi spiežot caur firehose.

Algoritms jeb algoritms tiek izmantots, lai apstrādātu datus, bieži tos ievietojot spaiņos, kas dos galīgo secinājumu. Piemēram, ja meklējat kaut ko pakalpojumā Google vai Bing, meklēšanas rezultāti, kas jums tiek atgriezti, ir iegūti no algoritma.

Meklētājprogrammas algoritms noteicis, ka, ko jūs vēlaties, pamatojoties uz jūsu meklēšanu, tas, ko viņi jums atklāj.

Twitter algoritms, kas lasa un sakārto Tweets, ļauj Twitter izdomāt, kas notiek jebkur.

Piemēram, kad miris Mihails Džeksons, viņa nāve tika atzīmēta pirmā, pēc tam divas, tad četras, pēc tam sešas no desmit populārākajām tēmām pēcpusdienā. Un tas bija divdesmit minūtes pirms vietējās radio ziņu stacijas to paziņoja.

Katra gada beigās Twitter publicē "Zelta Tweets" lapu, kurā ir redzami visjaunākie tweets par gadu. Tie ir dati, kurus viņi nekad nespēs analizēt bez konkrēta algoritma, kas paredzēts šo retweets skaitīšanai.

Kad čivināt pirmo reizi atklāja jauno cilni Atklājiet, viņi rakstīja par algoritmu, ko izmanto tā izveidei:

"Mēs sākam ieviest jaunu cilnes Atvērt versiju, kas jums ir vēl vairāk personalizēta. Mēs esam uzlabojuši mūsu personalizācijas algoritmus, lai iekļautu vairākus jaunus signālus, tostarp kontus, kurus sekojat un kam sekojat. Visi šie sociālie dati ir izmantots, lai izprastu jūsu intereses un parādītu stāstus, kas jums ir saistīti reāllaikā.

Aiz ainas, jaunā cilnē Atklājums ir powered by Earlybird, čivināt reāllaika meklēšanas tehnoloģija. Kad lietotājs tweets, šis čivināt ir indeksēti un kļūst par meklēšanu sekundēs. Katru čivināt ar saiti veic arī dažas papildu apstrādes: mēs iegūstam un paplašinām visus Tweets pieejamos vietrāžos URL un pēc tam ielādējam šo URL saturu ar mūsu reālā laika URL adresi SpiderDuck.

Lai ģenerētu stāstus, kuru pamatā ir jūsu sociālais grafiks un kurus mēs uzskatām par visinteresantākajiem, mēs vispirms izmantojam Cassovary, mūsu grafu apstrādes bibliotēku, lai identificētu jūsu savienojumus un tos klasificētu atkarībā no tā, cik stipra un svarīga ir šie savienojumi.

Kad mēs esam izveidojuši šo tīklu, mēs izmantojam Twitter elastīgo meklētājprogrammu, lai atrastu vietrāžus URL, kurus kopīgoja šis cilvēku loks. Šīs saites tiek pārvērstas stāstiem, kurus mēs kopā ar citiem stāstiem rādīsim cilnē Atklāj. Pirms to parādīšanas gala reitings pārsūta stāstus, atkarībā no tā, cik daudzi cilvēki ir tweeted par viņiem un cik svarīgi šie cilvēki ir saistībā ar jums. Tas viss notiek gandrīz reālā laikā, kas nozīmē, ka jaunajā cilnē Atklājums tiek parādīti pārkāpumi un attiecīgie stāsti gandrīz tiklīdz cilvēki sāk runāt par tiem. "

Lielākā daļa uzņēmumu ar algoritmiem apstrādā datu tonnas katru dienu. Algoritmi bieži atjaunina pēc nepieciešamības. Piemēram, pēdējo vairāku gadu laikā Google ir atjauninājis savu meklēšanas algoritmu (līdz ar to, ka SEO ir visur), tonnu reižu. Tas, ko jūs iegūstat šodien kā meklēšanas rezultātu jebkurai konkrētai meklēšanai, ir ļoti maz ticams tam, ko jūs varētu atrast pirms daudziem gadiem.

Twitter paša meklēšanas algoritmi ir ieguvuši arī neticami dinamisku. Jūs varat atrast cilvēkus, kuri konkrēti uzdod jautājumus, kuri savā čivināt izmanto smiley seju, un personas, kuras Tweeting ir īpaši jūsu ģeogrāfiskajā atrašanās vietā.

Twitter algoritmam nav jābūt tik agresīvam kā Google, bet tas noteikti ir stabils un efektīvi tiek izmantots, lai radītu jaunus veidus, kā apskatīt čivināt esošos datus.

Bieži uzrakstītie pārkāpumi:

twitter algorythm
Algoritms