Как любил говорить бывший директор Google Эрик Шмидт, от зари цивилизации и до 2003 года человечество сгенерировало пять экзабайт данных. Сейчас мы производим пять экзабайт каждые два дня и темп ускоряется. В нашем пост-конфиденциальном мире распространяющегося социального медиа обмена, GPS слежения, башен триангуляции, беспроводных датчиков мониторинга, браузеров куки-таргетинга, методов распознавания лиц, потребительских намерений профилирования и бесконечного числа других средств, которые создают наше личное присутствие в базах данных выходящих далеко за пределы нашей досягаемости, и когда граждане, в основном, не в восторге от передачи властям всех этих данных для помощи в принятии более взвешенных решений.
Пришло время вернуть понятие Data mining из маркетинга (microtargeting) , мер против мошенничества кредитных компаний и навязчивого наблюдения проспонсируемого государством эпохи Тотальной Информационной Осведомленности. Мы должны больше думать о нашей собственной выгоде от извлечения моделей, которые превращают наши сырьевые потоки личных данных в интеллектуальную, полезную информацию. Все мы только выиграем, если идея личного интеллектуального Data mining станет частью популярного дискурса.
Microsoft увидел потенциал еще в сентябре 2006 года, когда подала заявки на патент США номер 20080082393 для системы «personal data mining» . Подаваясь как база данных, предоставленная самими пользователями или собранная третьими лицами, технология будет затем анализировать "идентификацию возможностей и / или предоставления рекомендаций по повышению производительности пользователя и / или улучшения качества жизни".
И я, как гражданин и общество в целом выиграет, если бы личный поток данных физических лиц сможет быть извлечен с целью создания шаблонов, с которыми мы могли бы действовать. Такая добыча превратит мою исходные данные в интеллектуальную информацию, которая может предвидеть мое настроение и улучшить эффективность, сделай меня здоровее и более эмоционально интуитивным, раскрыть мои слабости в спекуляции и мои творческие силы. Я хочу найти скрытые смыслы, неожиданные корреляции, выявить тенденции и факторы риска, о которых я не знал. В эпоху oversharing, мы должны больше думать о самопознании управляемыми данными.
Небольшое, но быстрорастущее движение уже демонстрирует потенциал такого мышления, вдохновленное примерами самоподсчета Кавина Келли и управляемую данными жизнь Гэри Вольфа. С датчиков и мобильных приложений это движение отслеживает и измеряет физические упражнения, сон, активность, продуктивность, фармацевтическое состояние, ДНК, сердцебиение, диету, финансовые расходы, а также обменивается и отображает свои выводы для большего коллективного понимания. Он использует свои средства кластеризации, классификации и правила обнаружения сырых данных, но в основном это просто количественные данные.
Кумулятивный эффект такого мышления будет альтруистическим, а не нарциссическим, будет ли идти речь об объединении персональных данных для большего научного понимания (23andMe) или о пропаганде, передаваемой пользователями для мотивации изменения поведения у других (traineo). В самом деле, работа Дэниел Канеман, Даниэль Гилберт и Христакиса Фаулера ярко продемонcтрировала,что отслеживание данных на индивидуальном уровне является ключом к пониманию того, как человеческое счастье может быть определено количественно, как наши социальные сети влияют на наше поведение и как болезни распространяются через группы .
Данные уже находятся там. Нам просто нужно поощрять людей прикоснутся, поделиться ими, и присвоить это знание.
David Rowan
Editor, Wired magazine’s UK edition
Пришло время вернуть понятие Data mining из маркетинга (microtargeting) , мер против мошенничества кредитных компаний и навязчивого наблюдения проспонсируемого государством эпохи Тотальной Информационной Осведомленности. Мы должны больше думать о нашей собственной выгоде от извлечения моделей, которые превращают наши сырьевые потоки личных данных в интеллектуальную, полезную информацию. Все мы только выиграем, если идея личного интеллектуального Data mining станет частью популярного дискурса.
Microsoft увидел потенциал еще в сентябре 2006 года, когда подала заявки на патент США номер 20080082393 для системы «personal data mining» . Подаваясь как база данных, предоставленная самими пользователями или собранная третьими лицами, технология будет затем анализировать "идентификацию возможностей и / или предоставления рекомендаций по повышению производительности пользователя и / или улучшения качества жизни".
И я, как гражданин и общество в целом выиграет, если бы личный поток данных физических лиц сможет быть извлечен с целью создания шаблонов, с которыми мы могли бы действовать. Такая добыча превратит мою исходные данные в интеллектуальную информацию, которая может предвидеть мое настроение и улучшить эффективность, сделай меня здоровее и более эмоционально интуитивным, раскрыть мои слабости в спекуляции и мои творческие силы. Я хочу найти скрытые смыслы, неожиданные корреляции, выявить тенденции и факторы риска, о которых я не знал. В эпоху oversharing, мы должны больше думать о самопознании управляемыми данными.
Небольшое, но быстрорастущее движение уже демонстрирует потенциал такого мышления, вдохновленное примерами самоподсчета Кавина Келли и управляемую данными жизнь Гэри Вольфа. С датчиков и мобильных приложений это движение отслеживает и измеряет физические упражнения, сон, активность, продуктивность, фармацевтическое состояние, ДНК, сердцебиение, диету, финансовые расходы, а также обменивается и отображает свои выводы для большего коллективного понимания. Он использует свои средства кластеризации, классификации и правила обнаружения сырых данных, но в основном это просто количественные данные.
Кумулятивный эффект такого мышления будет альтруистическим, а не нарциссическим, будет ли идти речь об объединении персональных данных для большего научного понимания (23andMe) или о пропаганде, передаваемой пользователями для мотивации изменения поведения у других (traineo). В самом деле, работа Дэниел Канеман, Даниэль Гилберт и Христакиса Фаулера ярко продемонcтрировала,что отслеживание данных на индивидуальном уровне является ключом к пониманию того, как человеческое счастье может быть определено количественно, как наши социальные сети влияют на наше поведение и как болезни распространяются через группы .
Данные уже находятся там. Нам просто нужно поощрять людей прикоснутся, поделиться ими, и присвоить это знание.
David Rowan
Editor, Wired magazine’s UK edition