MAX
Подпишись
стань автором. присоединяйся к сообществу!

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в наш Телеграм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: sdelanounas.ru

Комментарии 0

Для комментирования необходимо войти на сайт

  • 2
    Нет аватара guest16.12.15 12:09:19

    real 16.80

    То есть масштабируется с частотой ~ 800/1600.

    • 2
      Нет аватара nesk16.12.15 12:31:23

      да! точно.

      Интересно посмотреть время выполнения программы для Эльбруса без оптимизации и с оптимизацией -O2

      Что бы оценить на сколько эффективно отрабатывает компилятор, какой он дает вклад (на VLIW с явным параллелизмом — это критически важно)

      PS Хотя, если мы получили корреляцию с частотой, то можно предположить, что лучше оно уже не параллелится.

      Отредактировано: nesk~13:43 16.12.15
      • 3
        Нет аватара guest16.12.15 13:23:24

        То -O2 не это -O2, и не -O2 у gfortran.

        Смотреть надо время выполнения критических кусков кода, для ifc x86_64 это так:

        ifort -pg -O2 -o test main79.f pythia-6.4.28.f && ./test && gprof ./test gmon_out

        ^^^ в gmon_out '_' надо заменить на '.'

        P.S.

        Для Xeon L5640 gfortran-4.4 -O2 -march=core2 -mtune=core2 генерит в ~2 раза более медленный код (120 сек / 1e4 событий), чем ifort -O2 -march=core2 -mtune=core2 (70 сек / 1e4 событий). Так что Интел что-то знает за свои машины, чего не знает gcc.

        P.P.S.

        Вывод gprof после ifort более осмысленный. Ожидаемо время тратится на вычисление медленно сходящихся логарифмов.

        см. gmon* под hermes(dot)ihep(dot)su(colon)8001/pool/atlas/p6/

        Отредактировано: vx8400 .~15:21 16.12.15