Darmowy kurs SNA

Logo CourseraOd dawna jestem entuzjastą edukacji w modelu MOOC (Massive Open Online Course), teraz nadarza się okazja do zareklamowania kursu z Analizy sieci społecznych prowadzonego na Coursera. Zapisać się i brać udział może absolutnie każdy chętny, nie ma ograniczeń, ani opłat! A jednocześnie zajęcia będą z pewnością na najwyższym światowym poziomie. Poprowadzi je Lada Adamic będąca profesorem w School of Information i Center for the Study of Complex Systems na University of Michigan w Ann Arbor. Lada potrafi świetnie wykładać – odkąd poznałem ją w 2004 roku, na konferencji Sunbelt, widziałem kilka jej wystąpień na innych konferencjach i zawsze były ciekawe. Polecam też jej prace naukowe, których sporo można znaleźć na jej stronie.

Kurs zaczyna się 24tego września i będzie trwać 8 tygodni. Uczestnicy powinni być przygotowani na poświęcenia około 5-7 godzin tygodniowo, nieco więcej w przypadku wykonywania dodatkowych zadań. Kurs składa się z serii 8-12 minutowych filmów, do których będą 1-2 quizy. Uczestnicy dostaną prace domowe i opcjonalne dodatkowe zadania. Kurs kończy się egzaminem, a ci którzy zaliczą cały kurs dostaną certyfikat ukończenia.

Gorąco polecam!

Opublikowano ogólne | Otagowano | 3 komentarzy

Sieci wokół PSL jako sieci

Przemysław Biecek na blogu SmarterPoland komentuje infografikę Gazety Wyborczej prezentującą relacje pomiędzy posłami PSL, członkami ich rodzin oraz innymi osobami pracującymi w Ministerstwie Rolnictwa oraz różnych spółkach i agencjach.

Infografika aspiruje to miana „bezinfografiki” (są jeszcze „dezinfografiki”, ale w tym przypadku nie jest tak źle). Jedyne informacje, które można z niej łatwo wyczytać, to imiona i nazwiska osób oraz nazwy organizacji, w których te osoby pracują. Jednocześnie najwartościowsza informacja jest w tej wizualizacji raczej nieczytelna, mianowicie relacje pomiędzy osobami a organizacjami oraz relacje pomiędzy osobami via organizacje, w których pracują. Przemek zaproponował ciekawy i przejrzysty sposób dzięki któremu możemy łatwo odczytać, kto gdzie pełni jaką funkcję i w której radzie nadzorczej zasiada.

Mimo tego, nadal trudno zorientować się jak współ-zasiadanie w radach nadzorczych (bądź pełnienie innych funkcji) może kreować potencjalną wspólnotę interesów pomiędzy poszczególnymi osobami. Jak więc pokazać te relacje? Czemu nie explicite jako sieć.

Poniższy obrazek prezentuje relacje pomiędzy osobami (niebieski) a organizacjami (pomarańczowy).

Zapewne bardziej interesujące są powiązania pomiędzy osobami, bo to one kreują potencjalną wspólnotę interesów. Poniższy obrazek prezentuje sieć pomiędzy osobami, w której istnienie relacji pomiędzy dwoma osobami oznacza, że są one związane z tą samą organizacją (co najmniej jedną). Przykładowo relacja pomiędzy panią Magdaleną Koseł a panią Anitą Szczykutowicz reprezentuje fakt, iż obie są zatrudnione w Ministerstwie Rolnictwa.

Poszczególne osoby zajmują różne pozycje w tej sieci. Sieciową pozycję można charakteryzować na wiele sposobów. Przykłady dwóch wskaźników to liczba relacji (tzw. degree) oraz betweenness centrality, który mierzy stopień, w jakim dana osoba zapośrednicza relacje pomiędzy innymi osobami. Na poniższym obrazku liczba relacji reprezentowana jest przez wielkość kółek, kolor (od żółtego do czerwonego) reprezentuje  wielkość betweenness centrality. W tej sieci pan Andrzej Śmietanko ma największą liczbę relacji oraz największą wartość betweenness centrality.

Sieciowe analizy współ-zasiadania w radach nadzorczych mają długą tradycję. Przeglądowe artykuły na ten temat, to na przykład:

Zainteresowanym polecam też amerykańskie serwisy LittleSis, który zawiera różnorakie dane dotyczące powiązań w biznesie i polityce oraz oparty na LittleSis serwis TheyRule, w którym można obejrzeć wiele ciekawych interaktywnych wizualizacji sieci opartych o dane z LittleSis.

Opublikowano analizy sieciowe | Otagowano , | Skomentuj

Correlate!

Niedawno Google udostępnił, rozwijaną wcześniej w Google Labs, usługę Google Correlate. Stała się ona częścią narzędzia Google Trends, pozwalającego śledzić trendy w popularności haseł wpisywanych przez użytkowników w wyszukiwarkę. Do niedawna możliwe było wyłącznie sprawdzanie i porównywanie względnej częstości wyszukiwania konkretnych haseł i ich zmian w czasie. Dzięki Google Correlate można znaleźć, hasła których dynamika popularności jest najbardziej zbliżona do trendów zdefiniowanych przez użytkownika.

Z nowego narzędzia możemy skorzystać na dwa sposoby. Można załadować własne dane dotyczące jakiegoś trendu w czasie lub samodzielnie narysować trend na wykresie. W obu przypadkach serwis poda nam jakie hasła wyszukiwane przez użytkowników miały najbardziej zbliżoną dynamikę. Dostaniemy listę haseł, odpowiednie wykresy i możliwość eksportu danych w pliku .csv.

Google Correlate to moim zdaniem bardzo fajne narzędzie. Jeżeli chcemy analizować dynamikę różnych zjawisk zachodzących w czasie, to warto sprawdzić jakie hasła mają podobną dynamikę. Szkoda tylko, że nie można jeszcze, tak jak w narzędziu Insights for Search, zawęzić wyników tylko do konkretnego kraju.

Opublikowano internet | Otagowano , , | Skomentuj

Sfilmowane wykłady keynote z konferencji Sunbelt

Miesiąc temu pisałem o konferencji Sunbelt i ciekawych keynote’ach, które się tam odbyły. Okazuje się, że oba zostały sfilmowane. Co więcej, oba keynote’y na poprzednim Sunbelcie również. Można sobie ściągnąć stąd.

Opublikowano analizy sieciowe, konferencje | Otagowano , , | 1 komentarz

Przewidywanie w naukach społecznych

Web of War (c) Nature

Ostatni numer Nature zawiera ciekawy tekst „Web of War” na temat zastosowań analizy sieci społecznych i innych metod obliczeniowych do przewidywania zjawisk społecznych. Artykuł omawia kilka przykładów zastosowań modelowania matematycznego i analiz dużych wolumenów danych do predykcji zdarzeń dla Pentagonu i armii amerykańskiej na potrzeby prowadzenia działań w Iraku i w Afganistanie. Część zastosowań jest udanych, część nie.

Analiza sieci społecznych przyczyniła się do pojmania Saddama Husajna przewidując, że będzie on raczej opierał się na osobach zaufanych, ale niebędących prominentnymi członkami reżimu. Metody obliczeniowe, jak twierdzi autorka, pozwoliły też na zlokalizowanie składów materiałów wybuchowych rebeliantów w Bagdadzie z dokładnością do 1000 metrów.

Lista nieudanych zastosowań jest jednak dużo dłuższa. W artykule autorka wymienia min.: przewidywanie czy dany film z Georgem Clooney’em okaże się sukcesem kasowym, przewidywanie konfliktów międzynarodowych i wojen domowych.

Artykuł przypomniał mi o projekcie FuturICT, który aspiruje do europejskiego grantu flagowego. Projekt ten przewiduje między innymi zbudowanie wielkoskalowej symulacji komputerowej, która w założeniach ma pozwalać na przewidywanie zjawisk społecznych w podobny sposób, jak to jest opisane w artykule w Nature. Przewidywanie zjawisk tak różnych, jak dynamika epidemii, konflikty etniczne, kryzysy finansowe, zanieczyszczenie środowiska, migracje i inne zmiany populacyjne. To wszystko za miliard (1`000`000`000) euro przez 10 lat.

Wątpliwości do dyskusji:

  1. Czy wiemy wystarczająco dużo o zjawiskach społecznych żeby nas było stać na tego rodzaju inwestycję?
  2. Czy zjawiska, które mają być prognozowane w tym projekcie przypominają przewidywanie czy film będzie sukcesem, bo George Clooney grał w nim z brodą, czy też bardziej przypominają poszukiwanie składów amunicji w Bagdadzie?
Opublikowano analizy sieciowe | Otagowano , , | 3 komentarzy