Форум ИГШ (НЕАКТИВЕН!!!)

Красный Дом (проверка бэкапа igstab.net)
Текущее время: 09 дек 2019 09:42

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 38 ]  На страницу 1, 2  След.
Автор Сообщение
 Заголовок сообщения: тегирование
СообщениеДобавлено: 11 окт 2005 12:08 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
Года два назад для простейшей разметки научных материалов использовал следующую схему:

Past Present Future
Net Tech Politics (Economy, Culture)
Local State Global

Получалось 27 разделов

1. Past_Tech_Local
2. Present_Tech_Local
3. Future_Tech_Local
4. Past_Net_Local
5. Present_Net_Local
6. Future_Net_Local
7. Past_Politics_Local
8. Present_Politics_Local
9. Future_Politics_Local
10. Past_Tech_State
11. Present_Tech_State
12. Future_Tech_State
13. Past_Net_State
14. Present_Net_State
15. Future_Net_State
16. Past_Politics_State
17. Present_Politics_State
18. Future_Politics_State
19. Past_Tech_Global
20. Present_Tech_Global
21. Future_Tech_Global
22. Past_Net_Global
23. Present_Net_Global
24. Future_Net_Global
25. Past_Politics_Global
26. Present_Politics_Global
27. Future_Politics_Global

Может нам вставить десяток таких или подобных тегов в интерфейс сообщения? Единственно волей терзающей меня жажды эксперимента?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 11 окт 2005 12:18 
Не в сети
Недобитый репликант
Аватар пользователя

Зарегистрирован: 05 окт 2005 15:02
Сообщений: 1559
Откуда: Где-то между Германией и Японией
А как? На уровне движка?

_________________
...all those moments will be lost in time, like tears in rain


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 11 окт 2005 15:55 
Не в сети
Орден Октябрьской Звезды
Аватар пользователя

Зарегистрирован: 06 окт 2005 10:53
Сообщений: 3346
Хмм... А национализировать можно? ;)

_________________
"...так же я полагаю, что наш мир должен быть ошустрен" (с)


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 11 окт 2005 16:19 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
al_mt";p="563 писал(а):
Хмм... А национализировать можно? ;)


Пожалуйста.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 12 окт 2005 11:32 
Не в сети
Орден Октябрьской Звезды
Аватар пользователя

Зарегистрирован: 06 окт 2005 10:53
Сообщений: 3346
Тьфу! Локализовать ;) Чтоб по русски было :)

_________________
"...так же я полагаю, что наш мир должен быть ошустрен" (с)


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 21 окт 2005 19:24 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
Статистика по росту блогосферы и тегированию в социальных системах.
http://www.alwayson-network.com/comment ... 1_0_27_0_C


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 21 окт 2005 22:27 
Теги (в контексте тегирования) - это искусственно добавленные к тексту ключевые слова. Так что любой текст изначально естественно тегирован. Остается иметь словари близких по значению слов и проводить поиск текстов по ним, а не по отдельным ключевым словам. Здесь есть проблемы - в трудоемкости создания таких словарей :(


Вернуться наверх
  
 
 Заголовок сообщения:
СообщениеДобавлено: 24 окт 2005 14:32 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
Такие готовые словари сущетсвуют, насколько я знаю. Есть даже реализованные в форме SQL.

_________________
Иногда вывозят и логарифмы.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 28 окт 2005 15:33 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 05 окт 2005 20:13
Сообщений: 825
Навеяло просмотром форума "Ужас":
Вообще говоря, никакой необходимости в разнесении постов по конкретным веткам ("hi-tech", "military") нет. Достаточно было бы метить посты метакми-тэгами при написании, и просмотр топика свелся бы к просмотру отфильтрованных по соответствующему тэгу постов. Собственно, при таком подходе необходимость в древовидной структуре (Форум->Топик в форуме-> Пост в топике) отпадает, и один и тот же пост можно будет помечать несколькими тэгами - для пользователя создастся иллюзия нахождения поста одновременно в нескольких топиках.

_________________
Программисты любят проблемы, которые они могут воспроизвести более чем один раз.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 28 окт 2005 15:53 
Не в сети
Недобитый репликант
Аватар пользователя

Зарегистрирован: 05 окт 2005 15:02
Сообщений: 1559
Откуда: Где-то между Германией и Японией
del.icio.us :( Со всеми вытекающими.

_________________
...all those moments will be lost in time, like tears in rain


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 28 окт 2005 16:03 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 05 окт 2005 20:13
Сообщений: 825
veter";p="2367 писал(а):
del.icio.us :( Со всеми вытекающими.

эээ... а что именно такого плохого вытекает? а то я с делицио знаком слабо...

_________________
Программисты любят проблемы, которые они могут воспроизвести более чем один раз.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 28 окт 2005 16:09 
Не в сети
Недобитый репликант
Аватар пользователя

Зарегистрирован: 05 окт 2005 15:02
Сообщений: 1559
Откуда: Где-то между Германией и Японией
Теггинг не может быть свободным. Иначе появятся всякие теги вроде "Это интересно", "Ништяк", "прочитать потом" и т.п. Необходим controlled vocabulary, как говорится. С прописанными связями и весами связей (ну и типом тоже). Но все это - на движке phpBB - это нонсенс. По крайней мере, я этого не вижу.

_________________
...all those moments will be lost in time, like tears in rain


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 28 окт 2005 16:20 
Не в сети
Капитан III ранга

Зарегистрирован: 08 окт 2005 18:34
Сообщений: 347
gnuzzz";p="2357 писал(а):
Собственно, при таком подходе необходимость в древовидной структуре (Форум->Топик в форуме-> Пост в топике) отпадает, и один и тот же пост можно будет помечать несколькими тэгами - для пользователя создастся иллюзия нахождения поста одновременно в нескольких топиках.

Примерно так устроен drupal. Там пост можно отнесни сразу к нескольким категориям, причем сами категории могут быть организованы в иерархическую структуру. Собственно, "форум" там есть визуализация такой категории и в него попадают все сообщения, к ней отнесенные... или к ее подкатегориям... вот не помню как там с объединениями/пересечениями, но не удивлюсь, если есть.

Правда, это работает для заглавных постов топика, но не для комментов.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 28 окт 2005 19:32 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 05 окт 2005 20:13
Сообщений: 825
veter";p="2374 писал(а):
Теггинг не может быть свободным. Иначе появятся всякие теги вроде "Это интересно", "Ништяк", "прочитать потом" и т.п. Необходим controlled vocabulary, как говорится. С прописанными связями и весами связей (ну и типом тоже). Но все это - на движке phpBB - это нонсенс. По крайней мере, я этого не вижу.

Почему нет? Просто он должен быть модерируемым. Ведь никто не запрещает сейчас создавать топики с названиями "Это интересно", "Ништяк" и т.д.

_________________
Программисты любят проблемы, которые они могут воспроизвести более чем один раз.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 28 окт 2005 19:40 
Не в сети
Недобитый репликант
Аватар пользователя

Зарегистрирован: 05 окт 2005 15:02
Сообщений: 1559
Откуда: Где-то между Германией и Японией
Ну это и есть controlled vocabulary. Много работы для модераторской группы, а мы тут все лени-и-и-ивые! :)

_________________
...all those moments will be lost in time, like tears in rain


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 31 окт 2005 17:26 
Не в сети
Капитан II ранга

Зарегистрирован: 05 окт 2005 19:50
Сообщений: 1124
veter";p="2454 писал(а):
Ну это и есть controlled vocabulary. Много работы для модераторской группы, а мы тут все лени-и-и-ивые! :)

Мне кажется полезным определить или выделить Acting controlling by technology.

То есть. если определена некоторая технология, то считается определенным ее инструментарий (можно и тэгами- но визуально это для человека смайлики, а не тэги).

Возьмем Википедию.
Если я пишу для Википедии, то я мог бы разметить текст такими примочками: не уверен, здесь дать ссылку на обоснование, послать сообщение такому пусть проверит, уровень (можно делать несколько уровней, в зависимости от потребности пользователя - краткий, с семантическими связями, обоснованный, полемический)


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 05 ноя 2005 06:08 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
veter";p="2374 писал(а):
Теггинг не может быть свободным. Иначе появятся всякие теги вроде "Это интересно", "Ништяк", "прочитать потом" и т.п. Необходим controlled vocabulary, как говорится. С прописанными связями и весами связей (ну и типом тоже). Но все это - на движке phpBB - это нонсенс. По крайней мере, я этого не вижу.


То есть задача разбивается на два вопроса:

1) можем ли мы технически тупо прописать тег "тема", используя для этого поле "тема" при отправке сообщения, так, чтобы потом эти теги могли учитываться, хотя бы как в livejournal или citeyoulike
2) можем ли мы написать (или взять готовый) controlled vocabulary для таких тегов. (Кстати, а из архива прошлых сообщений их нельзя вытащить?)


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 05 ноя 2005 19:36 
Не в сети
Капитан II ранга

Зарегистрирован: 06 окт 2005 08:57
Сообщений: 911
Откуда: Екатеринбург
"нет" на оба вопроса.
Аргументацию, если кому нужно, разверну, но это в аське меня нужно выискивать - писать неконструктивные вещи на форум считаю бессмысленным (то есть, я не знаю здесь ответа как. Я знаю только, почему не.)


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 13 фев 2006 10:56 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
http://sartac.livejournal.com/79825.html?mode=reply

Здесь - основные типы объектов, которые описывает наша MGI-классификация. Критика, вопросы и дополнения очень ожидаются.

_________________
Иногда вывозят и логарифмы.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 15 фев 2006 08:49 
Не в сети
Капитан I ранга
Аватар пользователя

Зарегистрирован: 05 окт 2005 21:58
Сообщений: 2489
Откуда: Москва
ознакомился.

для того чтоб внятно покритикивовать .. разовью мысль:

в построении классификаций лично использовал 2 подхода (см рис 1)
(I) "кристалл" = каждый элемент(позиция) четко отделен от другого
(вплоть до логического дополнения => (А) = не(Б))
(т.е. если элемент принадлежит к классу 1.1.2. то он никак не может также принадлежать классу 2.3.4.);
-> дифференциация/композиция элементов описывается деревом;
-> исходным положением при поиске - является весь объем элементов;
-> алгоритм поиска по дереву типа "Пракситель" = "отсекаем все лишнее, пока не найдется единственный, наиболее подходящий лист дерева";

(-) недостаток способа - степень дискретности имеет предел => грубость определения - потеря нюансов при описании.
(+) хорошо подходит для построения стабильных/статических/неизменных классификаций.

(II) "коктейль" -
(элемент принадлежащий классу А, одновременно может принадлежать также классу Б, и классу Ц, а может и не принадлежать)
-> дифференциация/композиция - описывается "функцией сочетаемости" на декартовом произведении элементов;
-> исходным элементом при поиске является какой-то один (возможно произвольный) элемент;
-> алгоритм поиска - типа "серфинг" - передвигаемся от одного элемента к другому по цепочке ассоциаций, пока не достигнем элемента, который нам больше всего понравится...

(-) недостаток способа - существенно меньшая предсказуемость и существенно большие ресурсные затраты на осуществления поиска (вокруг нужного элемента можно долго нарезать круги, но так его и не достигнуть...)
(+) подходит для построения нестабильных/динамических/мутирующих классификаций.


собственно критика:
в представленной классификации есть черты и (I) и (II), что "не есть хорошо".
сочетание противопложностей чудесно, но сконструировать его еще надо суметь.
у вас не видно четкого осознания когда должна закончиться "деревянность" и начаться "компот".

наблюдается интуитивное понимание проблемы предела дискретности (дипломные работы не подразделяем на магистерские, бакалаврские, специалистские и пр. А то замучаемся...)

если задумка была в "четкости и деревянности" - для этого между каждой парой элементов необходимо уметь вычислить сродство(=эквивалентность) и разницу(=дельту).
но если сродство между элементами нулевое, то и дельту фиг определишь (как между 1.5. "товар" и 1.2.9. "библиография").
в таком случае - классификации надо расщепить на несколько ортогональных деревьев.
или же надо забыть про деревья вовсе - и перейти к чистому "коктейлю".


Вложения:
01-variant.jpg
01-variant.jpg [ 10.01 KIB | Просмотров: 11617 ]

_________________
Непереводимый монгольский фольклор..
Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 15 фев 2006 09:27 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
Ок, спасибо. Подход к типу объектов в нашем случае определялся стремлением к подходу (I). То есть в первом "слоте" классификатора подход (II) использоваться не должен. Для случаев, когда такое невозможно, предполагалось классифицировать объект еще раз. Проблема заключается в том, что в классификации мы ограничены "разумной" длиной URL, который должен быть запоминаем и логичен. Исходя из этого требования, мы решили максмиально "одеревянить" слот типов объектов. При этом , конечно, многие объекты надо классифцировать два раза: что неудобно, но отвечает одному из наших прикладных правил "Идентичных объектов не бывает. Бывают объекты со множественной идентичностью." Как избежать проблем пересечения типов (I) и (II) другим образом, мы не знаем, увы.

_________________
Иногда вывозят и логарифмы.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 15 фев 2006 10:26 
Не в сети
Капитан I ранга
Аватар пользователя

Зарегистрирован: 05 окт 2005 21:58
Сообщений: 2489
Откуда: Москва
угу...
если дерево - тогда уж требуется четче обрисовывать сродство/дельту...

вот к примеру мысль про "1.3 учебные ресурсы":
любые материалы подгоняемые под эту категорию обладают свойством "используются в учебном процессе" (а не "то, что никак не лезет в науку" :wink: ) = это есть сродство.

разницу можно описать например через то, кому документ "адресован".
скажем (1) = "преподаватель", а (2) = "воспитуемый"...

тогда:

1.3 учебные ресурсы = school
[->(2)] 1.3.1 учебник = textbook textbook, edubook

[->(2)] 1.3.2 учебное пособие = tutorial edu-guide, edu-aid, teach-aid

либо [->(1)] либо [->(2)] 1.3.3 методическое пособие
=> разделение неудачно

[->(1)] учебно-методическая помощь преподавателю instructional support services

(?)методическое пособие | общ. teacher edition
(?)методическое пособие по боевой подготовке how-to-teach aid
(?)учебно-методическое пособие guidance manual

(?) 1.3.4 учебный курс = course
[(1)->(2)] 1.3.5 курс лекций = lect , lecture, lectures


[->(2)] 1.3.6 сборник задач = task
[->(2)] 1.3.7 сборник тестов = test
=> это если они без ответов студента... а иначе это [(1)<-(2)] как и:
[(1)<-(2)]1.3.12 реферат = summary студенческий иначе это "обзор, рецензия"

(?) 1.3.8 иные контрольные материалы = exam
???для кого предназначены ??? преподавателю? студенту?

[->(1)] 1.3.9 учебный план = curric
(?)1.3.10 учебная программа = syllab
[->(2)]1.3.11 хрестоматия = reader

при этом следует четче разграничить с материалы с разнотипной направленностью (типа простого "методического пособия") и прибить дубликаты.

чтобы не терять ясность, количество веток - желательно - не должно превышать "магического числа" 7±2.

_________________
Непереводимый монгольский фольклор..


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 15 фев 2006 16:32 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 05 окт 2005 20:13
Сообщений: 825
ko4evnik";p="7695 писал(а):
классификации надо расщепить на несколько ортогональных деревьев.

[встает рядом]
И проблема дискретности решается очень просто - вместо
10. Работы дипломные
10.1 Работы дипломные бакалаврские
10.2 Работы дипломные магистерские
10.3 Работы дипломные специалистские

будет 2 дерева:
1. Работа лабораторная
2. Работа курсовая
3. Работа дипломная

а. Работа бакалаврская
б. Работа магистерская
в. Работа специалистская

А URL в таком случае будет выглядеть не традиционным DNS-именем (a.b.c), но более сложной конструкцией с параметрами:
1.2.3&a.b.c&X.Y.Z или
path1=1.2.3&path2=a.b.c&path3=X.Y.Z

_________________
Программисты любят проблемы, которые они могут воспроизвести более чем один раз.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 15 фев 2006 17:11 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 08 окт 2005 14:35
Сообщений: 999
gnuzzz";p="7768 писал(а):
ko4evnik";p="7695 писал(а):


А URL в таком случае будет выглядеть не традиционным DNS-именем (a.b.c), но более сложной конструкцией с параметрами:
1.2.3&a.b.c&X.Y.Z или
path1=1.2.3&path2=a.b.c&path3=X.Y.Z


Программисты... Вот именно этого мы и стремимся избежать - адрес должен быть запоминаемым и конструируемым. Поэтому a.b.с - это предел сложности конструкции (еще используются "_ "и "-").


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 15 фев 2006 19:06 
Не в сети
Капитан II ранга
Аватар пользователя

Зарегистрирован: 05 окт 2005 20:13
Сообщений: 825
sartac";p="7772 писал(а):
gnuzzz";p="7768 писал(а):


А URL в таком случае будет выглядеть не традиционным DNS-именем (a.b.c), но более сложной конструкцией с параметрами:
1.2.3&a.b.c&X.Y.Z или
path1=1.2.3&path2=a.b.c&path3=X.Y.Z


Программисты... Вот именно этого мы и стремимся избежать - адрес должен быть запоминаемым и конструируемым. Поэтому a.b.с - это предел сложности конструкции (еще используются "_ "и "-").

Ну, имхо запоминаемым он в любом случае не будет - слишком большой глубины дерево получится, не будет удовлетворять критерию "7 +/- 2".

_________________
Программисты любят проблемы, которые они могут воспроизвести более чем один раз.


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 38 ]  На страницу 1, 2  След.

Часовой пояс: UTC + 3 часа [ Летнее время ]


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB