Compare commits
9 Commits
| Author | SHA1 | Date | |
|---|---|---|---|
| 546cafe6bc | |||
| 9dd4d99a1a | |||
| 3a6273777a | |||
| daed585347 | |||
| 11d7229525 | |||
| e43d52df20 | |||
| 1c0da3c5b9 | |||
| 3084db8b26 | |||
| cba263ff12 |
@ -7,7 +7,7 @@ endif (NOT CMAKE_BUILD_TYPE)
|
||||
enable_language(C ASM)
|
||||
|
||||
project(mckernel C ASM)
|
||||
set(MCKERNEL_VERSION "1.7.3")
|
||||
set(MCKERNEL_VERSION "1.7.6")
|
||||
|
||||
# See "Fedora Packaging Guidelines -- Versioning"
|
||||
set(MCKERNEL_RELEASE "")
|
||||
|
||||
194
docs/NEWS.rst
194
docs/NEWS.rst
@ -1,3 +1,197 @@
|
||||
=============================================
|
||||
Version 1.7.6 (Mar 11, 2021)
|
||||
=============================================
|
||||
|
||||
----------------------
|
||||
IHK major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
IHK major bug fixes
|
||||
------------------------
|
||||
#. ihklib: ihk_reserve_mem_conf*: apply change only to the next reservation
|
||||
|
||||
----------------------
|
||||
McKernel major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
McKernel major bug fixes
|
||||
------------------------
|
||||
N/A
|
||||
|
||||
=============================================
|
||||
Version 1.7.5 (Mar 11, 2021)
|
||||
=============================================
|
||||
|
||||
----------------------
|
||||
IHK major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
IHK major bug fixes
|
||||
------------------------
|
||||
#. ihklib: fix cgroup cpuset.cpus/mems check when using krm
|
||||
#. ihklib: ihk_reserve_mem_conf_str: set default values to those not specified
|
||||
|
||||
----------------------
|
||||
McKernel major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
McKernel major bug fixes
|
||||
------------------------
|
||||
N/A
|
||||
|
||||
=============================================
|
||||
Version 1.7.4 (Mar 7, 2021)
|
||||
=============================================
|
||||
|
||||
----------------------
|
||||
IHK major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
IHK major bug fixes
|
||||
------------------------
|
||||
N/A
|
||||
|
||||
----------------------
|
||||
McKernel major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
McKernel major bug fixes
|
||||
------------------------
|
||||
N/A
|
||||
|
||||
=============================================
|
||||
Version 1.7.3 (Mar 5, 2021)
|
||||
=============================================
|
||||
|
||||
----------------------
|
||||
IHK major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
IHK major bug fixes
|
||||
------------------------
|
||||
N/A
|
||||
|
||||
----------------------
|
||||
McKernel major updates
|
||||
----------------------
|
||||
N/A
|
||||
|
||||
------------------------
|
||||
McKernel major bug fixes
|
||||
------------------------
|
||||
N/A
|
||||
|
||||
=============================================
|
||||
Version 1.7.2 (Mar 5, 2021)
|
||||
=============================================
|
||||
|
||||
----------------------
|
||||
IHK major updates
|
||||
----------------------
|
||||
#. ihklib: add *_str() functions for reserve, assign, IKC-map, kargs
|
||||
#. smp: make smp_call_func() arch independent
|
||||
|
||||
------------------------
|
||||
IHK major bug fixes
|
||||
------------------------
|
||||
#. ihklib: ihk_reserve_mem: fix capped best-effort
|
||||
#. TO RESET: fake missing NUMA node pieces, 90% memory limit
|
||||
#. ihklib: ihk_reserve_mem_conf: range-check for IHK_RESERVE_MEM_MAX_SIZE_RATIO_ALL
|
||||
#. ihklib: ihk_os_kargs: check if "hidos" is included
|
||||
#. SMP: omit slab/slub shrink, use 95% limit by default
|
||||
#. check cpu / numa cgroup set by krm
|
||||
#. SMP: __ihk_smp_reserve_mem: add __GFP_COMP to __GFP_ATOMIC allocation
|
||||
#. ihk_register_device: record minor to IHK device object
|
||||
|
||||
----------------------
|
||||
McKernel major updates
|
||||
----------------------
|
||||
#. mcexec: memory policy control by environmental variable
|
||||
#. mempolicy: Support MPOL_INTERLEAVE
|
||||
#. uti: futex call function in mcctrl
|
||||
#. uti: integrate libuti and redirect to mck/libuti.so
|
||||
#. uti: integrate syscall_intercept
|
||||
#. shmobj: support large page
|
||||
#. xpmem: support large page
|
||||
#. MM: handle zero_at_free in page faults
|
||||
|
||||
------------------------
|
||||
McKernel major bug fixes
|
||||
------------------------
|
||||
#. TO RESET: stack changes
|
||||
#. Tofu: keep track of stags per memory range
|
||||
#. Tofu: match page sizes to MBPT and fault PTEs if not present
|
||||
#. Tofu: fix phys addr calculation for contiguous pages in MBPT/BCH update
|
||||
#. rus_vm_fault: vmf_insert_pfn: treat VM_FAULT_NOPAGE as success
|
||||
#. Tofu: mcctrl side MMU notifier and CQ/BCH cleanup
|
||||
#. copy_user_ranges: copy straight_start of struct vm_range
|
||||
#. mcctrl: abort on invalid addr in mcexec_transfer_image()
|
||||
#. mcctrl: fix access to uninitialized usrdata->cpu_topology_list
|
||||
#. mcexec: propagate error in __NR_gettid handler
|
||||
#. mcexec_transfer_image(): map exact size of remote memory (instead of forcing PAGE_SIZE)
|
||||
#. xpmem: fault stack area of remote process if VM range doesn't yet exist
|
||||
#. Tofu: fault stack area if VM range doesn't exist in STAG registration
|
||||
#. __mcctrl_os_read_write_cpu_register: fix timeout
|
||||
#. mbind: Use range_policy's numamask as priority on MPOL_BIND
|
||||
#. migrate: Don't migrate on in-kernel interrupt
|
||||
#. Send a signal to mcexec after switching to that process.
|
||||
#. uti: fix syscall response is mis-consumed by __do_in_kernel_irq_syscall
|
||||
#. uti: fix handling UTI_CPU_SET env
|
||||
#. do_execveat: kill instead of panic when init_process_stack fails
|
||||
#. remote_page_fault is handled by the offloaded thread.
|
||||
#. coredump: fix behavior when gencore fail
|
||||
#. xpmem: truncates the size of xpmem_attach at the page boundary (workaround for fjmpi)
|
||||
#. __mcctrl_os_read_write_cpu_register: spin timeout in mcctrl_ikc_send_wait()
|
||||
|
||||
=============================================
|
||||
Version 1.7.1 (Dec 23, 2020)
|
||||
=============================================
|
||||
|
||||
----------------------
|
||||
IHK major updates
|
||||
----------------------
|
||||
#. d5d5c23 Tofu: support for barrier gate
|
||||
#. Tofu: proper cleanup of premapped DMA regions
|
||||
#. Tofu: initial version
|
||||
#. SMP: try with GFP_ATOMIC as well in mem reserve
|
||||
|
||||
------------------------
|
||||
IHK major bug fixes
|
||||
------------------------
|
||||
#. ihklib: ihk(_os)_query_{cpu,mem}: allow to pass empty array
|
||||
#. SMP: non compound page free and GFP_ATOMIC
|
||||
#. ihk_get_num_os_instances: don't open /dev/mcdN
|
||||
#. ihklib: ihk_create_os_str: fix variable prefix
|
||||
|
||||
----------------------
|
||||
McKernel major updates
|
||||
----------------------
|
||||
#. stragiht map: creates a straight map covering the whole physical memory, and gives virtual address ranges out of it to maps to which physical pages are allocated on map
|
||||
#. free-time, lazy, potentially Linux-side page-zeroing
|
||||
#. Tofu built-in driver: supports memory registration and barrier gate setup
|
||||
#. kmalloc cache
|
||||
|
||||
------------------------
|
||||
McKernel major bug fixes
|
||||
------------------------
|
||||
#. mmap: return -EINVAL for non-anonymous, MAP_HUGETLB map
|
||||
#. kernel: increase stack size
|
||||
#. Tofu: proper cleanup of device files when mcexec gets killed
|
||||
|
||||
=============================================
|
||||
Version 1.7.0 (Nov 25, 2020)
|
||||
=============================================
|
||||
|
||||
Binary file not shown.
@ -649,7 +649,9 @@ IHKはLinuxに以下の機能を提供する。
|
||||
\begin{tabular}[t]{@{}l@{}}
|
||||
{\quad} \texttt{int ihk\_reserve\_mem\_conf(int index, int key, void *value)}\\
|
||||
\end{tabular}
|
||||
\subsubsection*{説明}{\quad} \texttt{index}で指定されたIHKデバイスに対する\texttt{ihk\_reserve\_mem()}の動作を\texttt{key}と\texttt{value}のペアで指定したものに変更する。\texttt{value}は値へのポインタで指定する。\texttt{key}と\texttt{value}のペアの意味は以下のように定義される。
|
||||
\subsubsection*{説明}{\quad} \texttt{index}で指定されたIHKデバイスに対する\texttt{ihk\_reserve\_mem()}の動作を\texttt{key}と\texttt{value}のペアで指定したものに変更する。なお、設定は次の1回の予約に限り有効で、予約後にはデフォルト設定に戻る。
|
||||
|
||||
\texttt{value}は値へのポインタで指定する。\texttt{key}と\texttt{value}のペアの意味は以下のように定義される。
|
||||
|
||||
\subsubsection*{\texttt{IHK\_RESERVE\_MEM\_BALANCED\_\{ENABLE,BEST\_EFFORT,VARIANCE\_LIMIT\}}}
|
||||
\verb|IHK_RESERVE_MEM_BALANCED_ENABLE|(型は\verb|int|、デフォルトは0)が非ゼロの場合は、NUMAノードごとの予約サイズがNUMAノード間でなるべく均等になるように予約する。目的は、NUMAノードごとのメモリ空き容量にNUMAノード間でばらつきがあり、またそれらの空き容量が事前にわからないようなシステムで、合計予約サイズをより大きくすることである。ステップは以下の通り。
|
||||
@ -686,7 +688,7 @@ IHKはLinuxに以下の機能を提供する。
|
||||
|
||||
\subsubsection{設定リストによるメモリ予約動作設定}
|
||||
\subsubsection*{書式}{\quad} \verb:int ihk_reserve_mem_conf_str(int dev_index, const char *envp, int num_env);:
|
||||
\subsubsection*{説明}{\quad} \verb:dev_index:で指定されたIHKデバイスに対し、\verb:envp:と\verb:num_env:で指定された文字列形式の設定リストに従ってメモリ予約の動作設定を行う。本関数は特権ユーザのみが呼び出せる。
|
||||
\subsubsection*{説明}{\quad} \verb:dev_index:で指定されたIHKデバイスに対し、\verb:envp:と\verb:num_env:で指定された文字列形式の設定リストに従ってメモリ予約の動作設定を行う。なお、設定は次の1回の予約に限り有効で、予約後にはデフォルト設定に戻る。本関数は特権ユーザのみが呼び出せる。
|
||||
|
||||
\verb:envp:は\verb:NULL:文字で結合された\verb:num_env:個の設定文字列からなる。各設定文字列は\verb:"KEY=VAL":の形式を持つ。設定可能な項目は以下の通り。
|
||||
\begin{table}[!h]
|
||||
@ -702,7 +704,7 @@ IHKはLinuxに以下の機能を提供する。
|
||||
\end{tabular}
|
||||
\vspace{-0em}
|
||||
\end{table}
|
||||
\\なお、これ以外の設定は無視される。
|
||||
\\また、これら以外の設定項目は無視される。
|
||||
\FloatBarrier
|
||||
|
||||
\subsubsection*{戻り値}
|
||||
|
||||
@ -2001,31 +2001,26 @@ int mcexec_open_exec(ihk_os_t os, char * __user filename)
|
||||
goto out_free;
|
||||
}
|
||||
|
||||
/* fget and list_add should be atomic */
|
||||
down(&mckernel_exec_file_lock);
|
||||
|
||||
file = open_exec(kfilename);
|
||||
retval = PTR_ERR(file);
|
||||
if (IS_ERR(file)) {
|
||||
up(&mckernel_exec_file_lock);
|
||||
goto out_free;
|
||||
}
|
||||
|
||||
fullpath = d_path(&file->f_path, pathbuf, PATH_MAX);
|
||||
if (IS_ERR(fullpath)) {
|
||||
up(&mckernel_exec_file_lock);
|
||||
retval = PTR_ERR(fullpath);
|
||||
goto out_put_file;
|
||||
goto out_free;
|
||||
}
|
||||
|
||||
mcef = kmalloc(sizeof(*mcef), GFP_KERNEL);
|
||||
if (!mcef) {
|
||||
up(&mckernel_exec_file_lock);
|
||||
retval = -ENOMEM;
|
||||
goto out_put_file;
|
||||
}
|
||||
memset(mcef, 0, sizeof(struct mckernel_exec_file)); /* debug */
|
||||
|
||||
down(&mckernel_exec_file_lock);
|
||||
/* Find previous file (if exists) and drop it */
|
||||
list_for_each_entry(mcef_iter, &mckernel_exec_files, list) {
|
||||
if (mcef_iter->os == os && mcef_iter->pid == task_tgid_vnr(current)) {
|
||||
|
||||
2
ihk
2
ihk
Submodule ihk updated: 17cd4c9656...8e637b7873
@ -7,7 +7,7 @@ xpmemやshmobjを利用するライブラリの初期化および基本動作を
|
||||
|
||||
□実行手順
|
||||
1.
|
||||
SSMで以下のとおりサンプルプログラムをビルドする。
|
||||
ログインノードで以下のとおりサンプルプログラムをビルドする。
|
||||
必要に応じて PATHを設定すること。
|
||||
|
||||
tradモード:
|
||||
@ -18,7 +18,7 @@ $ mpifccpx -DMPI -DOPENMP -Kopenmp mpi+affinity.c -o mpi+llvmopenmp-affinity
|
||||
|
||||
2.
|
||||
インタラクティブモードでジョブ実行を開始する。
|
||||
SSMで以下のように pjsubコマンドを発行する。
|
||||
ログインノードで以下のように pjsubコマンドを発行する。
|
||||
rscunitやrscgrp、jobenvは環境に応じて指定すること。
|
||||
|
||||
$ pjsub --interact -L "rscunit=xxx,rscgrp=xxx,jobenv=xxx,node=1" --mpi "proc=2" --sparam wait-time=1000
|
||||
|
||||
@ -54,7 +54,8 @@ sudo ./ctrl 1 1 1 0 0 0 1 1 1
|
||||
|
||||
(2) uti_perf
|
||||
|
||||
progress threadを用いたtofu get通信速度を計測する。
|
||||
progress threadを用いたtofu get通信速度を測定する。
|
||||
測定結果は 10 ns 単位で出力される。
|
||||
オプションは以下のとおり。
|
||||
|
||||
-a <x>,<y>,<z>,<a>,<b>,<c>
|
||||
@ -80,7 +81,7 @@ progress threadを用いたtofu get通信速度を計測する。
|
||||
|
||||
-l <length>
|
||||
tofu get通信するデータサイズ(byte)を指定する。
|
||||
(64 byte ~ 16*1024*1024 - 256 byte、既定値は 16*1024*1024 - 256 byte)
|
||||
(16 Kbyte ~ 16 Mbyte - 256 byte、既定値は 16 Mbyte - 256 byte)
|
||||
|
||||
-v
|
||||
デバッグ出力を有効にする。
|
||||
@ -110,3 +111,13 @@ progress threadを用いたtofu get通信速度を計測する。
|
||||
|
||||
--recvusleep=<us>
|
||||
progress threadの受信完了を確認する間隔 (usec) を指定する。 (既定値は0)
|
||||
|
||||
例えば、tofu座標が 0,0,0,0,0,0 (受信側) と 0,0,0,1,0,0 (送信側) の間で
|
||||
24プロセス生成して 16 Kbyte のデータを送信する測定を 100回繰り返す場合は
|
||||
次のように指定する。
|
||||
|
||||
(受信側)
|
||||
./uti_perf -a 0,0,0,1,0,0 -n 100 -f 24 -l 16384 -r
|
||||
(送信側)
|
||||
./uti_perf -a 0,0,0,0,0,0 -n 100 -f 24 -l 16384
|
||||
|
||||
|
||||
Reference in New Issue
Block a user